Применение комплекса инструментов управления корпусами текстов при решении задач компьютерной лингвистики

Авторы

  • Сергей Александрович Полицын Московский авиационный институт (национальный исследовательский университет)
  • Екатерина Валерьевна Полицына Московский авиационный институт (национальный исследовательский университет)

DOI:

https://doi.org/10.17308/sait.2019.2/1300

Ключевые слова:

корпус текстов, инструменты автоматизированного анализа текстов, разметка корпуса, краулер, управление корпусами текстов

Аннотация

Одной из актуальных задач компьютерной лингвистики, необходимых для решения других задач, в т. ч. для использования методов машинного обучения, разработки и апробации новых алгоритмов, является задача составления, разметки и оперативного пополнения корпусов текстов. В статье освещается разработка и применение комплекса инструментов управления корпусами текстов, который позволит создавать субкорпуса по настраиваемому набору признаков.

Биографии авторов

  • Сергей Александрович Полицын, Московский авиационный институт (национальный исследовательский университет)

    канд. техн. наук, доцент, институт No 3, кафедра 319, Московский авиационный институт (Национальный исследовательский университет)

  • Екатерина Валерьевна Полицына, Московский авиационный институт (национальный исследовательский университет)

    канд. техн. наук, доцент, институт No 3, кафедра 319, Московский авиационный институт (Национальный исследовательский университет

Библиографические ссылки

Загрузки

Опубликован

2019-04-24

Выпуск

Раздел

Компьютерная лингвистика и обработка естественного языка

Как цитировать

Применение комплекса инструментов управления корпусами текстов при решении задач компьютерной лингвистики. (2019). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2, 134-142. https://doi.org/10.17308/sait.2019.2/1300

Наиболее читаемые статьи этого автора (авторов)