Mikhail
29.08.2025
RAG
0,0
236
Что такое векторная база данных
Обычные базы данных (БД) хранят информацию в привычном формате: строки, числа, даты. Поиск в них основан на точном совпадении или фильтрации по определённым критериям. Например, вы ищете пользователя по имени …
Статьи о RAG
RAG (Retrieval-Augmented Generation) — архитектурный паттерн, который позволяет языковой модели отвечать на вопросы по вашим данным без переобучения. Документы, базы знаний, внутренние регламенты — всё это можно подключить к LLM и получать точные ответы со ссылками на источники.
На этой странице собраны материалы по всем этапам построения RAG-систем: подготовка данных (парсинг, чистка, чанкинг), создание эмбеддингов (OpenAI, Cohere, локальные модели), выбор векторной базы данных (Chroma, Pinecone, Weaviate, pgvector), настройка ретривера и генерации ответа.
Разбираем популярные фреймворки: LangChain, LlamaIndex, Haystack. Сравниваем подходы: naive RAG, advanced RAG с реранкингом, hybrid search (dense + sparse), HyDE и другие техники повышения точности.
Отдельные материалы посвящены оценке качества RAG-систем: как измерить faithfulness, answer relevance и context recall без ручной разметки. Рассматриваем типичные ошибки и способы их диагностики.
Подходит для разработчиков, которые строят корпоративные чат-боты, системы поиска по документам и AI-ассистентов с доступом к актуальным данным.
На этой странице собраны материалы по всем этапам построения RAG-систем: подготовка данных (парсинг, чистка, чанкинг), создание эмбеддингов (OpenAI, Cohere, локальные модели), выбор векторной базы данных (Chroma, Pinecone, Weaviate, pgvector), настройка ретривера и генерации ответа.
Разбираем популярные фреймворки: LangChain, LlamaIndex, Haystack. Сравниваем подходы: naive RAG, advanced RAG с реранкингом, hybrid search (dense + sparse), HyDE и другие техники повышения точности.
Отдельные материалы посвящены оценке качества RAG-систем: как измерить faithfulness, answer relevance и context recall без ручной разметки. Рассматриваем типичные ошибки и способы их диагностики.
Подходит для разработчиков, которые строят корпоративные чат-боты, системы поиска по документам и AI-ассистентов с доступом к актуальным данным.