Возможный алгоритм вычисления предельного размера словаря писателя

Авторы

DOI:

https://doi.org/10.17308/sait.2021.1/3378

Ключевые слова:

коэффициент лексического разнообразия, закон Ципфа, экстраполяция, лемматизированный частотный словарь, предельный размер словаря

Аннотация

В работе предлагается метод оценивания предельного размера словаря писателя с помощью экстраполяции эмпирически задаваемой функции, выражающей зависимость коэффициента лексического разнообразия от объема текстового корпуса. Обсуждаются возникающие проблемы адекватности выбираемого способа экстраполяции. На примере творчества Л. Н. Толстого произведены расчеты с помощью логарифмических базисных функций для аппроксимации и экстраполяции.

Биографии авторов

  • Алексей Александрович Кретов, Воронежский государственный университет

    д-р филол. наук, проф., профессор кафедры теоретической и прикладной лингвистики Воронежского государственного университета

  • Мария Викторовна Ломец, Воронежский государственный университет

    студентка кафедры теоретической и прикладной лингвистики факультета Романо-германской филологии Воронежского государственного университета

  • Игорь Петрович Половинкин, Воронежский государственный университет

    д-р физ.-матем. наук, профессор кафедры математического и прикладного анализа, доцент кафедры теоретической и прикладной лингвистики Воронежского государственного университета

Библиографические ссылки

Загрузки

Опубликован

2021-04-29

Выпуск

Раздел

Компьютерная лингвистика и обработка естественного языка

Как цитировать

Возможный алгоритм вычисления предельного размера словаря писателя. (2021). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 1, 133-145. https://doi.org/10.17308/sait.2021.1/3378

Наиболее читаемые статьи этого автора (авторов)