Гайды по RAG
RAG (Retrieval-Augmented Generation): векторные базы данных, чанкинг, эмбеддинги, LangChain, LlamaIndex. Как подключить собственные данные к LLM.
Михаил Омельченко
01.09.2025
Chroma как начать работать с векторным поиском
Chroma — это мощная векторная база данных, которая упрощает работу с векторными эмбеддингами и семантическим …
Михаил Омельченко
31.08.2025
Chroma что это и как работает
В эпоху, когда искусственный интеллект становится движущей силой инноваций, традиционные методы работы с данными уходят …
Гайды по RAG
На этой странице собраны материалы по всем этапам построения RAG-систем: подготовка данных (парсинг, чистка, чанкинг), создание эмбеддингов (OpenAI, Cohere, локальные модели), выбор векторной базы данных (Chroma, Pinecone, Weaviate, pgvector), настройка ретривера и генерации ответа.
Разбираем популярные фреймворки: LangChain, LlamaIndex, Haystack. Сравниваем подходы: naive RAG, advanced RAG с реранкингом, hybrid search (dense + sparse), HyDE и другие техники повышения точности.
Отдельные материалы посвящены оценке качества RAG-систем: как измерить faithfulness, answer relevance и context recall без ручной разметки. Рассматриваем типичные ошибки и способы их диагностики.
Подходит для разработчиков, которые строят корпоративные чат-боты, системы поиска по документам и AI-ассистентов с доступом к актуальным данным.