Статьи о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

02.03.2026

LLM
Star 0,0
Views 2

colyricist: ai для написания текстов песен

CoLyricist — это система искусственного интеллекта, разработанная для помощи в написании текстов песен, предоставляющая поддержку, соответствующую рабочему процессу. Система предназначена для работы с авторами песен на разных этапах их творческого …

Heli Verified

02.03.2026

LLM
Star 0,0
Views 2

Разработка многоагентной системы с использованием langgraph

Система многоагентной коммуникации производственного уровня может быть разработана с использованием структурированной шины сообщений LangGraph, журналирования ACP и архитектуры постоянного общего состояния.

LangGraph предоставляет структуру для построения приложений, объединяющих большие языковые …

Heli Verified

01.03.2026

LLM
Star 0,0
Views 4

Sigma: генеративная система рекомендаций для AliExpress

SIGMA – это система рекомендаций для AliExpress, основанная на генеративном подходе и семантическом понимании инструкций. Она разработана для выполнения нескольких задач и позволяет создавать рекомендации, соответствующие потребностям пользователей.

Архитектура SIGMA

Heli Verified

01.03.2026

LLM
Star 0,0
Views 6

Агентная самокоррекция: преодоление нежелания отвечать в llm

Агенты, основанные на больших языковых моделях (LLM), часто отказываются отвечать на вопросы, касающиеся чувствительной семантической информации. Это может быть связано с запрограммированными ограничениями или встроенными механизмами безопасности. В исследовании рассматривается …

Heli Verified

01.03.2026

LLM
Star 0,0
Views 4

See it, say it, sorted: упрощение рассуждений в lvlm

Визуально-обоснованное многомодальное рассуждение в больших языковых моделях (LVLMs) обычно требует трудоемкого обучения. Представлен новый итеративный, без-обучающий фреймворк под названием "See It, Say It, Sorted", призванный упростить этот процесс.

Этот фреймворк …

Heli Verified

01.03.2026

LLM
Star 0,0
Views 5

Улучшение многоязычных представлений посредством выравнивания

Улучшение многоязычных представлений посредством многостороннего выравнивания параллельных текстов

Многоязычные представления текста необходимы для многих задач обработки естественного языка, таких как межъязыковой поиск информации и машинный перевод. Существующие методы обычно полагаются …

Heli Verified

01.03.2026

LLM
Star 0,0
Views 6

radar: рассуждение как дискриминация для llm

RADAR: Рассуждение как дискриминация с использованием выровненных представлений для рассуждений на основе графов знаний большими языковыми моделями (LLM).

Представлена новая модель RADAR, предназначенная для улучшения рассуждений на основе графов знаний …

Heli Verified

01.03.2026

LLM
Star 0,0
Views 5

Swe-protégé: обучение маленьких llm с помощью эксперта

SWE-Protégé – это метод, позволяющий небольшим языковым моделям (LLM) выступать в качестве агентов для разработки программного обеспечения, за счет обучения выборочному сотрудничеству с экспертом. Исследователи разработали систему, в которой LLM, …

Статьи о больших языковых моделях

Большие языковые модели (LLM) — основа современного ИИ. На этой странице собраны материалы об архитектуре трансформеров, принципах предобучения и дообучения, токенизации и управлении контекстным окном.

Разбираем, чем отличаются ведущие модели: GPT-4o, Claude 3.5, Gemini 1.5 Pro, DeepSeek V3, Llama 3, Qwen и другие. Какую выбрать для конкретной задачи, как учитывать стоимость вывода, скорость генерации и точность.

Отдельные разделы посвящены файн-тюнингу (LoRA, QLoRA, SFT), работе с векторными базами данных в связке с LLM, локальному запуску моделей через Ollama и LM Studio, а также безопасности: ограничениям RLHF, джейлбрейкам и alignment-проблемам.

Для разработчиков — материалы по интеграции LLM через API OpenAI, Anthropic, Google, по оценке качества ответов (evals), оптимизации промптов и снижению латентности. Для исследователей — обзоры ключевых статей и бенчмарков: MMLU, HumanEval, LMSYS Chatbot Arena.

Следите за публикациями, чтобы не пропустить выход новых моделей и результаты сравнительных тестов.