Словарь
RAG
Retrieval-Augmented Generation (RAG) -- техника повышения точности и релевантности ответов языковых моделей за счёт предоставления внешнего контекста в момент запроса. Стандартная LLM генерирует ответы исключительно на основе паттернов, усвоенных при обучении, -- а значит, не знает о событиях после даты среза обучения и не имеет доступа к внутренним или актуальным данным. RAG решает это, извлекая релевантные документы из внешней базы знаний перед генерацией ответа.
Рабочий процесс состоит из двух основных этапов. Сначала шаг извлечения ищет в хранилище документов -- как правило, векторной базе данных -- контент, семантически близкий к входящему запросу. Затем извлечённый текст объединяется с запросом пользователя и передаётся языковой модели в качестве контекста. Модель генерирует ответ, опираясь одновременно на исходный вопрос и извлечённый материал, что заземляет результат в проверяемых источниках.
RAG стал стандартным паттерном в корпоративных AI-приложениях. Типичные сценарии: внутренние базы знаний, где сотрудники могут задавать вопросы по документам компании; системы поддержки клиентов, извлекающие руководства; инструменты правового исследования по судебной практике; любые приложения, где точность и атрибуция источников важнее творческой генерации.
Качество RAG-системы во многом определяется шагом извлечения. Если извлечены неправильные фрагменты, модель либо даст неверный ответ, либо скажет, что не может помочь. Стратегия нарезки на чанки, качество модели эмбеддингов и ранжирование релевантности существенно влияют на результат. Построение надёжного RAG-пайплайна требует тщательной оценки и итераций, а не просто соединения компонентов.