RAGLangChainAIАрхитектура

RAG в Telegram: контекстный AI без галлюцинаций

15 декабря 2025 г.

Kontora Studios

Главная проблема LLM-ботов — галлюцинации. Модель уверенно отвечает на вопрос, но ответ неверный. Для чат-бота поддержки или развлекательного бота это терпимо. Для бота, который даёт рекомендации по здоровью или обучает языку — недопустимо.

// Что такое RAG

Retrieval-Augmented Generation — подход, при котором модель не выдумывает ответ, а сначала ищет релевантную информацию в базе знаний, а потом формулирует ответ на основе найденных данных. Проще говоря: вместо «расскажи что знаешь» — «вот документы, ответь на основе них».

// Как это работает у нас

В PLOS база знаний — это структурированные данные о пептидах, их взаимодействиях, противопоказаниях и протоколах. Когда пользователь спрашивает «какой пептид поможет с восстановлением суставов?», система сначала ищет релевантные записи в базе (через embeddings и векторный поиск), а потом передаёт их GPT-4 как контекст. Модель формулирует ответ строго на основе этих данных.

RAG не устраняет галлюцинации на 100%, но снижает их до минимума. А главное — каждый ответ можно верифицировать: мы знаем, на какие документы опирался бот.

// LangChain как клей

LangChain — фреймворк, который связывает всё воедино: загрузку документов, разбиение на чанки, генерацию embeddings, векторный поиск и финальный промпт к LLM. Мы используем его и в PLOS, и в AI Teacher — для ответов на вопросы по грамматике на основе наших учебных материалов.

// Когда RAG не нужен

Не каждая задача требует RAG. Если бот генерирует творческий текст для упражнения, проверяет эссе или оценивает произношение — GPT-4 справляется сам. RAG нужен там, где важна фактическая точность: медицинские данные, справочная информация, персональная история пользователя.

← Все статьи Связаться →