IT & RAG / Архитектура RAG
RAG без eval превращается в поиск с красивым интерфейсом
Команды внедряют retrieval augmented generation, но часто поздно добавляют проверку полноты, релевантности и устойчивости ответов.
Сводка
Главное за 15 секунд
- RAG требует отдельных проверок retrieval и generation.
- Похожие документы не гарантируют наличие правильного фрагмента.
- Golden datasets и негативные запросы нужно готовить до production-запуска.
Что ломается
RAG-система может находить похожие документы, но пропускать нужный фрагмент, смешивать версии или отвечать уверенно при пустом контексте.
Как проверять
Нужны golden datasets, негативные запросы, трассировка retrieved chunks и отдельные метрики для retrieval и generation.
Практический вывод
Eval-пакет стоит собирать до запуска. Иначе команда не поймёт, улучшает ли новый индекс ответы или просто меняет стиль формулировок.
Обсуждение
Комментарии
Войдите через Google или Telegram, чтобы участвовать в обсуждении.