КОНТЕКСТУАЛЬНОЕ РАСПОЗНАВАНИЕ СЕМАНТИКИ МНОГОЗНАЧНЫХ СЛОВ СИСТЕМАМИ МАШИННОГО ПЕРЕВОДА

  • А. В. Новиков Орловский государственный университет имени И. С. Тургенева
Ключевые слова: машинный перевод, контекст, векторное представление слова, нейронная сеть, статистический перевод, исходный язык, язык перевода

Аннотация

В рамках этой статьи рассмотрены основные принципы, на которых строится работа систем машинного перевода, а также представлен сравнительный анализ перевода текстов разных стилей, чтобы проследить, как системы машинного перевода справляются с определением контекстуального значения слова, использованного в принципиально разных контекстах. Для проведения этого исследования выбраны четыре системы машинного перевода – Google Translate, Яндекс. Переводчик, DeepL и PROMT. В начале статьи перечислены основные подходы к машинному переводу, после чего представлено краткое описание принципов работы, выбранных нами систем машинного перевода. Далее приведены примеры употребления многозначных слов в разных контекстах, а также варианты их перевода на русский язык вышеупомянутыми системами машинного перевода, после чего проведен сравнительный анализ полученных переводов. В случае неправильно распознанных значений в программу-переводчик добавлялся расширенный контекст (абзац вместо предложения), так как предполагалось, что это может улучшить распознавание контекста, и как следствие, количество случаев корректного перевода значений выбранных нами слов. Гипотезой исследования было, что расширение контекста в случае нераспознанного значения должно помочь системе его распознать. Методом сплошной выборки мы отобрали сорок предложений, в которых двадцать одних и тех же слов использованы в разных контекстах и обладают разным значением. Выбирая примеры предложений для анализа, мы не придерживались конкретных тематик. Главным принципом для отбора слов послужило наличие у них многозначности. В заключении статьи представлен вывод и изложены основные аспекты настоящего исследования. Мы считаем, что описанный в этой работе эксперимент послужит хорошим подспорьем для дальнейших исследований в этой области, в частности для понимания того, каким образом осуществляется учет контекста и как возможно улучшить работу систем машинного перевода.

Скачивания

Данные скачивания пока не доступны.

Биография автора

А. В. Новиков, Орловский государственный университет имени И. С. Тургенева

аспирант кафедры английской филологии

Литература

Новиков А. В. Основные подходы к преобразованию текста в системах машинного перевода // Актуальные вопросы лингвистики и лингводидактики в контексте межкультурной коммуникации : сб. материалов III Всерос. науч.-практ. онлайн-конф. (30 марта 2023 г.) / под ред. О. Ю. Ивановой. Орел : ОГУ им. И. С. Тургенева , 2023. С. 195–203.

Козина А. В., Черепков Е. А., Белов Ю. С. Обзор подходов к машинному переводу // Междунар. студ. науч. вестник . 2018. № 6. URL: https://eduherald.ru/ru/article/view?id=19408

Как работает нейросеть Google Translate. URL:https://www.cossa.ru/152/196086/

О машинном переводе. Руководство разработчика . URL: https://yandex.ru/dev/translate/doc/dg/concepts/how-works-machine-translation.html

Как работает DeepL Переводчик . URL: https://www.deepl.com/ru/blog/how-does-deepl-work

Молчанов А.Статистические и гибридные методы перевода в технологиях компании PROMT // ControlEngineering Россия – Август 2013. URL: https://controlengrussia.com/innovatsii/statisticheskie-i-gibridny-e-metody-perevoda-vtehnologiyah-kompanii-promt/

Top 10 Snooker Shots of All Time: Jaw Dropping, Pure Magic, Surreal. URL: https://scorum.com/en-us/snooker/@jodcarey/top-10-snooker-shots-of-all-time-jawdropping-pure-magic-surreal

Salients, re-entrants and pockets. URL: https://military-history.fandom.com/wiki/Salients,_re-entrants_and_pockets

Britannica, Gauge. Railroad track. URL: https://www.britannica.com/technology/gauge-railroad-track

Understanding Pressure Gauge. URL: https://studentlesson.com/defi nition-uses-diagram-types-workingof-a-pressure-gauge/

Опубликован
2025-05-26
Как цитировать
Новиков, А. В. (2025). КОНТЕКСТУАЛЬНОЕ РАСПОЗНАВАНИЕ СЕМАНТИКИ МНОГОЗНАЧНЫХ СЛОВ СИСТЕМАМИ МАШИННОГО ПЕРЕВОДА. Вестник ВГУ. Серия: Лингвистика и межкультурная коммуникация, (3), 6-15. https://doi.org/10.17308/lic/1680-5755/2025/3/6-15
Раздел
Теоретическая и прикладная лингвистика