
Полная версия
RAG системы: Методы реализации – практическое руководство
В книге подробно рассматривается архитектура и принципы работы систем Retrieval-Augmented Generation (RAG), которые позволяют языковым моделям использовать актуальные и приватные данные из внешних источников. Автор пошагово разбирает процесс построения RAG — от выбора векторной базы данных и модели эмбеддингов до оптимизации поиска и генерации ответов. Особое внимание уделено теоретическим аспектам извлечения, фрагментации и векторизации данных, способам хранения, поиска и ранжирования. Современным интерфейсными решениями RAG систем, а также практическим способам реализации простых систем дополненного поиска. В издании приведены практические примеры на Python с использованием LangChain, FAISS, Milvus и HuggingFace. Книга рассчитана на начинающих разработчиков, инженеров данных и архитекторов ИИ-решений, которые хотят построить надёжные и масштабируемые системы дополненного поиска на базе LLM.