Статьи о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

01.03.2026

LLM
Star 0,0
Views 9

superglasses: оценка llm для умных очков

Мы представляем SUPERGLASSES, первую комплексную платформу для оценки языковых моделей (LLM) как интеллектуальных агентов для умных очков с искусственным интеллектом. SUPERGLASSES сочетает в себе реалистичный симулятор окружающей среды, систему оценки …

Heli Verified

01.03.2026

LLM
Star 0,0
Views 9

agentsentry: защита от косвенной инъекции промптов в llm

AgentSentry решает проблему косвенной инъекции промптов в агентах LLM за счет временной диагностике причинно-следственных связей и очистки контекста. Косвенная инъекция промптов возникает, когда вредоносные инструкции внедряются в источники данных, к …

Heli Verified

28.02.2026

LLM
Star 0,0
Views 7

ppcr-im: прогнозирование последствий государственной политики

PPCR-IM — это система для рассуждений о последствиях государственной политики на основе многослойного направленного ациклического графа (DAG) и сопоставления социальных индикаторов. Система сочетает в себе представление знаний на основе DAG …

Heli Verified

02.02.2026

LLM
Star 0,0
Views 82

Что такое параметры в машинном обучении?

Параметры – это переменные, которые модель машинного обучения настраивает в процессе обучения, чтобы делать точные прогнозы. По сути, это "ручки", которые алгоритм крутит, чтобы подстроиться под данные. Чем больше параметров, …

Heli Verified

02.02.2026

LLM
Star 0,0
Views 80

Создание AI-агентов с памятью: кратковременной, долговременной и эпизодической

Разработан слой памяти для AI-агента, разделяющий контекст, долговременную векторную память и эпизодические следы. Используется семантическое хранение с помощью векторных представлений и FAISS для быстрого поиска. Добавлена эпизодическая память, фиксирующая успешные …

Heli Verified

01.02.2026

LLM
Star 0,0
Views 71

Механистическое отслеживание данных: поиск истоков работы нейросетей

Ученые разработали метод, позволяющий понять, как конкретные элементы больших языковых моделей (LLM) формируются в процессе обучения. Новая технология, названная Mechanistic Data Attribution (MDA), использует так называемые "функции влияния", чтобы определить, …