Статьи о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

28.02.2026

LLM
Star 0,0
Views 76

ppcr-im: прогнозирование последствий государственной политики

PPCR-IM — это система для рассуждений о последствиях государственной политики на основе многослойного направленного ациклического графа (DAG) и сопоставления социальных индикаторов. Система сочетает в себе представление знаний на основе DAG …

Heli Verified

02.02.2026

LLM
Star 0,0
Views 160

Что такое параметры в машинном обучении?

Параметры – это переменные, которые модель машинного обучения настраивает в процессе обучения, чтобы делать точные прогнозы. По сути, это "ручки", которые алгоритм крутит, чтобы подстроиться под данные. Чем больше параметров, …

Heli Verified

02.02.2026

LLM
Star 0,0
Views 153

Создание AI-агентов с памятью: кратковременной, долговременной и эпизодической

Разработан слой памяти для AI-агента, разделяющий контекст, долговременную векторную память и эпизодические следы. Используется семантическое хранение с помощью векторных представлений и FAISS для быстрого поиска. Добавлена эпизодическая память, фиксирующая успешные …

Heli Verified

01.02.2026

LLM
Star 0,0
Views 136

Механистическое отслеживание данных: поиск истоков работы нейросетей

Ученые разработали метод, позволяющий понять, как конкретные элементы больших языковых моделей (LLM) формируются в процессе обучения. Новая технология, названная Mechanistic Data Attribution (MDA), использует так называемые "функции влияния", чтобы определить, …