Разработка и оценка RAG-системы для анализа семантических связей

Авторы

DOI:

https://doi.org/10.17308/sait/1995-5499/2025/2/114-126

Ключевые слова:

RAG (Retrieval Augmented Generation), большие языковые модели (LLM), семантическое сходство, квантизация, Milvus

Аннотация

В статье представлена разработка и оценка системы для автоматического определения семантической близости текстов в рамках специализированных предметных областей на основе метода RAG (Retrieval Augmented Generation). Предлагаемое решение интегрирует большие языковые модели (Llama, Gemma) с векторными базами данных (Milvus) для извлечения контекстно-релевантной информации. Основная задача системы — бинарная классификация пар текстовых описаний («целевой показатель — мероприятие») с целью выявления их смысловой связи. Экспериментальная часть включает сравнительный анализ эффективности различных конфигураций моделей и промптов. Наилучший результат продемонстрировала модель Llama-3.1-8B-Instruct, достигшая F1-меры 0.9 при использовании RAG-подхода. Важным элементом системы стала оптимизация генеративной части моделей за счет 4-битной квантизации, что позволило снизить вычислительные затраты без значительной потери точности. Показано, что включение в промпты релевантных примеров из векторной базы данных RAG-системы повышает точность классификации на 15–20 % по сравнению с базовыми настройками. Результаты подтверждают, что RAG-система эффективно адаптируется к узкоспециализированным текстам, таким как нормативные документы или стратегические планы. Практическая значимость работы заключается в возможности внедрения системы в процессы управления организационными мероприятиями, где критична проверка согласованности формулировок и выявление противоречий. Перспективы дальнейших исследований связаны с интеграцией современных языковых моделей (Qwen, DeepSeek), оптимизацией методов индексации в векторных хранилищах и совершенствованием шаблонов промптов.

Биографии авторов

  • Ирина Леонидовна Каширина, Российский технологический университет МИРЭА, Воронежский государственный университет

    д-р технических наук, проф., профессор кафедры технологий искусственного интеллекта РТУ МИРЭА; профессор кафедры математических методов исследования операций Воронежского государственного университета

  • Илья Ромуальдович Осипов, Воронежский государственный университет

    аспирант кафедры математических методов Воронежского государственного университета

  • Вячеслав Алексеевич Яковлев, Российский технологический университет МИРЭА

    аспирант кафедры технологий искусственного интеллекта РТУ МИРЭА.

Библиографические ссылки

Загрузки

Опубликован

2025-09-02

Выпуск

Раздел

Современные технологии разработки программного обеспечения

Как цитировать

Разработка и оценка RAG-системы для анализа семантических связей. (2025). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2, 114-126. https://doi.org/10.17308/sait/1995-5499/2025/2/114-126

Наиболее читаемые статьи этого автора (авторов)