Возможный алгоритм вычисления предельного размера словаря писателя
DOI:
https://doi.org/10.17308/sait.2021.1/3378Ключевые слова:
коэффициент лексического разнообразия, закон Ципфа, экстраполяция, лемматизированный частотный словарь, предельный размер словаряАннотация
В работе предлагается метод оценивания предельного размера словаря писателя с помощью экстраполяции эмпирически задаваемой функции, выражающей зависимость коэффициента лексического разнообразия от объема текстового корпуса. Обсуждаются возникающие проблемы адекватности выбираемого способа экстраполяции. На примере творчества Л. Н. Толстого произведены расчеты с помощью логарифмических базисных функций для аппроксимации и экстраполяции.
Библиографические ссылки
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).













