Многоязычный машинный перевод с помощью иерархического трансформера

Авторы

DOI:

https://doi.org/10.17308/sait.2022.1/9207

Ключевые слова:

нейронный машинный перевод, многоязычный перевод, организация параметров, языковые деревья, иерархическая архитектура, низкоресурсный перевод, родственные языки

Аннотация

Выбор стратегии распределения параметров между языками в моделях многоязычного машинного перевода определяет то, насколько оптимально используется пространство параметров. Следовательно, выбранная стратегия напрямую влияет на конечное качество перевода. Данная работа исследует новый подход к организации параметров в многоязычном машинном переводе на основе лингвистических деревьев, которые показывают степень родства между различными языками. Основная идея заключается в том, чтобы использовать эти экспертные языковые иерархии в качестве основы для архитектуры модели: чем ближе два языка, тем больше у них должно быть общих параметров. Мы испытываем эту идею для архитектуры Трансформер и показываем, что, несмотря на успех в предыдущих работах, существуют проблемы, присущие обучению таких иерархических моделей. Мы демонстрируем, что при специально подобранной стратегии обучения иерархическая архитектура может превзойти как простые двуязычные модели, так и многоязычные модели перевода с общим пространством параметров.

Биографии авторов

  • Альбина Маратовна Хусаинова, Автономная некоммерческая организация высшего образования Университет Иннополис

    аспирант 4-го года обучения, ассистент в лаборатории машинного обучения и представления данных Университета Иннополис

  • Виталий Анатольевич Романов, Автономная некоммерческая организация высшего образования Университет Иннополис

    аспирант 4-го года обучения, ассистент в лаборатории промышленной разработки ПО Университета Иннополис

  • Адил Мехмуд Хан, Автономная некоммерческая организация высшего образования Университет Иннополис

    канд. физ.-мат. наук, профессор, начальник лаборатории машинного обучения и представления данных Университета Иннополис

Библиографические ссылки

Загрузки

Опубликован

2022-04-26

Выпуск

Раздел

Компьютерная лингвистика и обработка естественного языка

Как цитировать

Многоязычный машинный перевод с помощью иерархического трансформера. (2022). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 1, 125-138. https://doi.org/10.17308/sait.2022.1/9207

Наиболее читаемые статьи этого автора (авторов)