Анализ подходов к автоматическому выделению контекстных синонимов из текстов на русском языке

  • Екатерина Валерьевна Полицына Московский авиационный институт (Национальный исследовательский университет) https://orcid.org/0000-0002-9313-4766
  • Сергей Александрович Полицын Московский авиационный институт (Национальный исследовательский университет) https://orcid.org/0000-0002-0744-6035
  • Александр Сергеевич Поречный Московский авиационный институт (Национальный исследовательский университет) https://orcid.org/0000-0003-2280-7406
  • Екатерина Евгеньевна Милованова Московский авиационный институт (Национальный исследовательский университет) https://orcid.org/0000-0003-3869-6851
Ключевые слова: contextual synonyms, automated extraction of synonyms, synonymy, semantic-syntactic analysis of the text

Аннотация

В статье рассматриваются проблемы определения контекстных синонимов, приводятся результаты анализа подходов к их автоматическому выделению из текстов на русском языке. Предлагается несколько подходов на основе применения лингвистических алгоритмов определения в тексте похожих семантико-синтаксических конструкций и их сочетания с методами машинного обучения. Анализируются полученные результаты применения алгоритмов на основе морфологического, синтаксического и семантического анализа текста, фильтрации полученных результатов путем использования ключевых слов и применения различных средств кластеризации. В заключении делаются выводы о применимости реализованных подходов и определяются направления развития сочетания этих подходов.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Екатерина Валерьевна Полицына, Московский авиационный институт (Национальный исследовательский университет)

канд. техн. наук, доцент, институт No3, кафедра 319, Московский авиационный институт (Национальный исследовательский университет).

Сергей Александрович Полицын, Московский авиационный институт (Национальный исследовательский университет)

канд. техн. наук, доцент, институт No3, кафедра 319, Московский авиационный институт (Национальный исследовательский университет)

Александр Сергеевич Поречный, Московский авиационный институт (Национальный исследовательский университет)

аспирант, институт No3, кафедра 319, Московский авиационный институт (Национальный исследовательский университет)

Екатерина Евгеньевна Милованова, Московский авиационный институт (Национальный исследовательский университет)

магистрант 2-го года обучения кафедры 319, институт No3, Московский авиационный институт (Национальный исследовательский университет)

Литература

1. Bender E. M. Linguistic Fundamentals for Natural Language Processing II: 100 Essentials from Semantics and Pragmatics / E. M. Bender. – Synthesis Lectures on Human Language Technologies. – London : Morgan & Claypool, 2019 – 268 p. DOI
2. Reformatskij A. A. (ed.) Vvedenie v jazykovedenie [Introduction to linguistics]. Moscow, Aspekt-Press. 1999. (in Russian)
3. Putjatina E. I. Kontekstual’naja sinonimija v tekste i ego diskurse [Contextual synonymy in the text and its discourse] Vestnik KGU im. N.A. Nekrasova. 2016. 4. P. 148–151. (in Russian)
4. Zaliznjak A. A. Fenomen mnogoznachnosti i sposoby ego opisanija [The phenomenon of polysemy and ways to describe it] Voprosy jazykoznanija. 2004. 4. P. 20–45. (in Russian)
5. Politsyna E. V. & Politsyn S. A. Realizacija dvuhurovnevogo semanticheskogo predstavlenija teksta v otkrytoj sisteme avtomatizirovannoj obrabotki teksta [The two-level semantic text representation in the open automated text processing system] Problemy komp’juternoj lingvistiki i tipologii, Sbornik nauchnyh trudov. 2017. 6. P. 98–105. (in Russian)
6. Zeng Xian-mo Semantic relationships between contextual synonyms: US-China Education Review. 2007. 4 (9). P. 33–37. (in English)
7. Bel’kova, A. E. Kontekstual’nye sinonimy kak stilisticheskoe sredstvo vyrazitel’nosti v jazyke pojezii [Contextual synonyms as a stylistic means of expression in the language of poetry] Vestnik NVGU. 2014. 4. P. 1–7. (in Russian)
8. Milovanova E. E. Primenenie nejronnyh setej dlja raspoznavanija kontekstnyh sinonimov [Using neural networks to recognize contextual synonyms] XLVI Gagarin Science Conference. Collection of abstracts. Moscow, Moscow Aviation Institute (National Research Univesity). 2020. P. 1731. (in Russian)
9. Politsyna E. V., Politsyn S. A., Porechny A. S. & Milovanova E. E. Problema i algoritm avtomaticheskogo vydelenija kontekstnyh sinonimov iz tekstov na russkom jazyke [The problem and the algorithm of automatic extraction of contextual synonyms from the texts in Russian language] IPMT-2020. Voronezh, Izdatel’stvo «Nauchno-issledovatel’skie publikacii» (OOO «Vjelborn»). 2020. P. 1663–1669. (in Russian)
10. Politsyna E. V., Politsyn S. A. & Porechny A. S. The Framework for Hypothesis Verification and Analysis of Natural Language Processing for the Russian Language (2018) Supplementary Proceedings of the Seventh International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018). 2018. V. 2268. P. 25–33. (in English)
11. Bisera, K.-S. The semantic aspect of the acquisition of synonyms, homonyms and antonyms in the teaching process of English as a foreign language. European Journal of Foreign Language Teaching. 2018. 3. P. 28–43. (in English)
12. Batura T. V. Metody avtomaticheskoj klassifikacii tekstov [Methods for automatic text classification] Tver, Zakrytoe akcionernoe obshhestvo Nauchno-issledovatel’skij institut «Centr-programmsistem». 2017. V. 1. (in Russian)
13. Ajvazjan S. A., Bezhaeva Z. I. & Staroverov O. V. Klassifikacija mnogomernyh nabljudenij [Classification of multidimensional observations]. Moscow, Statistika. 1974. (in Russian)
14. Kohonen T. Samoorganizujushhiesja karty [Self-Organizing Maps]. Translated from English by Tjumencevб Ju. V. (2008) Moscow, BINOM. 2001. (in Russian)
15. Hemming C. Using Neural Networks in Linguistic Resources. Department of Languages, University College of Skövde, Swedish National Graduate School of Language Technology. 2003. (in English)
16. Portal “Avtomatizirovannyj analiz teksta”. Automatic text summarization service. 2020 Available at: URL
17. Portal “Avtomatizirovannyj analiz teksta”. Tools for Automated Work with Text (TAWT). 2020. Available at: URL
Опубликован
2020-09-30
Как цитировать
Полицына, Е. В., Полицын, С. А., Поречный, А. С., & Милованова, Е. Е. (2020). Анализ подходов к автоматическому выделению контекстных синонимов из текстов на русском языке. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (3), 120-132. https://doi.org/10.17308/sait.2020.3/3046
Раздел
Компьютерная лингвистика и обработка естественного языка

Наиболее читаемые статьи этого автора (авторов)