Анализ подходов к автоматическому выделению контекстных синонимов из текстов на русском языке
Аннотация
В статье рассматриваются проблемы определения контекстных синонимов, приводятся результаты анализа подходов к их автоматическому выделению из текстов на русском языке. Предлагается несколько подходов на основе применения лингвистических алгоритмов определения в тексте похожих семантико-синтаксических конструкций и их сочетания с методами машинного обучения. Анализируются полученные результаты применения алгоритмов на основе морфологического, синтаксического и семантического анализа текста, фильтрации полученных результатов путем использования ключевых слов и применения различных средств кластеризации. В заключении делаются выводы о применимости реализованных подходов и определяются направления развития сочетания этих подходов.
Скачивания
Литература
2. Reformatskij A. A. (ed.) Vvedenie v jazykovedenie [Introduction to linguistics]. Moscow, Aspekt-Press. 1999. (in Russian)
3. Putjatina E. I. Kontekstual’naja sinonimija v tekste i ego diskurse [Contextual synonymy in the text and its discourse] Vestnik KGU im. N.A. Nekrasova. 2016. 4. P. 148–151. (in Russian)
4. Zaliznjak A. A. Fenomen mnogoznachnosti i sposoby ego opisanija [The phenomenon of polysemy and ways to describe it] Voprosy jazykoznanija. 2004. 4. P. 20–45. (in Russian)
5. Politsyna E. V. & Politsyn S. A. Realizacija dvuhurovnevogo semanticheskogo predstavlenija teksta v otkrytoj sisteme avtomatizirovannoj obrabotki teksta [The two-level semantic text representation in the open automated text processing system] Problemy komp’juternoj lingvistiki i tipologii, Sbornik nauchnyh trudov. 2017. 6. P. 98–105. (in Russian)
6. Zeng Xian-mo Semantic relationships between contextual synonyms: US-China Education Review. 2007. 4 (9). P. 33–37. (in English)
7. Bel’kova, A. E. Kontekstual’nye sinonimy kak stilisticheskoe sredstvo vyrazitel’nosti v jazyke pojezii [Contextual synonyms as a stylistic means of expression in the language of poetry] Vestnik NVGU. 2014. 4. P. 1–7. (in Russian)
8. Milovanova E. E. Primenenie nejronnyh setej dlja raspoznavanija kontekstnyh sinonimov [Using neural networks to recognize contextual synonyms] XLVI Gagarin Science Conference. Collection of abstracts. Moscow, Moscow Aviation Institute (National Research Univesity). 2020. P. 1731. (in Russian)
9. Politsyna E. V., Politsyn S. A., Porechny A. S. & Milovanova E. E. Problema i algoritm avtomaticheskogo vydelenija kontekstnyh sinonimov iz tekstov na russkom jazyke [The problem and the algorithm of automatic extraction of contextual synonyms from the texts in Russian language] IPMT-2020. Voronezh, Izdatel’stvo «Nauchno-issledovatel’skie publikacii» (OOO «Vjelborn»). 2020. P. 1663–1669. (in Russian)
10. Politsyna E. V., Politsyn S. A. & Porechny A. S. The Framework for Hypothesis Verification and Analysis of Natural Language Processing for the Russian Language (2018) Supplementary Proceedings of the Seventh International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018). 2018. V. 2268. P. 25–33. (in English)
11. Bisera, K.-S. The semantic aspect of the acquisition of synonyms, homonyms and antonyms in the teaching process of English as a foreign language. European Journal of Foreign Language Teaching. 2018. 3. P. 28–43. (in English)
12. Batura T. V. Metody avtomaticheskoj klassifikacii tekstov [Methods for automatic text classification] Tver, Zakrytoe akcionernoe obshhestvo Nauchno-issledovatel’skij institut «Centr-programmsistem». 2017. V. 1. (in Russian)
13. Ajvazjan S. A., Bezhaeva Z. I. & Staroverov O. V. Klassifikacija mnogomernyh nabljudenij [Classification of multidimensional observations]. Moscow, Statistika. 1974. (in Russian)
14. Kohonen T. Samoorganizujushhiesja karty [Self-Organizing Maps]. Translated from English by Tjumencevб Ju. V. (2008) Moscow, BINOM. 2001. (in Russian)
15. Hemming C. Using Neural Networks in Linguistic Resources. Department of Languages, University College of Skövde, Swedish National Graduate School of Language Technology. 2003. (in English)
16. Portal “Avtomatizirovannyj analiz teksta”. Automatic text summarization service. 2020 Available at: URL
17. Portal “Avtomatizirovannyj analiz teksta”. Tools for Automated Work with Text (TAWT). 2020. Available at: URL
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).