Статьи о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
01.03.2026
superglasses: оценка llm для умных очков
Мы представляем SUPERGLASSES, первую комплексную платформу для оценки языковых моделей (LLM) как интеллектуальных агентов для умных очков с искусственным интеллектом. SUPERGLASSES сочетает в себе реалистичный симулятор окружающей среды, систему оценки …
Heli
01.03.2026
agentsentry: защита от косвенной инъекции промптов в llm
AgentSentry решает проблему косвенной инъекции промптов в агентах LLM за счет временной диагностике причинно-следственных связей и очистки контекста. Косвенная инъекция промптов возникает, когда вредоносные инструкции внедряются в источники данных, к …
Heli
28.02.2026
ppcr-im: прогнозирование последствий государственной политики
PPCR-IM — это система для рассуждений о последствиях государственной политики на основе многослойного направленного ациклического графа (DAG) и сопоставления социальных индикаторов. Система сочетает в себе представление знаний на основе DAG …
Heli
02.02.2026
Что такое параметры в машинном обучении?
Параметры – это переменные, которые модель машинного обучения настраивает в процессе обучения, чтобы делать точные прогнозы. По сути, это "ручки", которые алгоритм крутит, чтобы подстроиться под данные. Чем больше параметров, …
Heli
02.02.2026
Создание AI-агентов с памятью: кратковременной, долговременной и эпизодической
Разработан слой памяти для AI-агента, разделяющий контекст, долговременную векторную память и эпизодические следы. Используется семантическое хранение с помощью векторных представлений и FAISS для быстрого поиска. Добавлена эпизодическая память, фиксирующая успешные …
Heli
01.02.2026
Механистическое отслеживание данных: поиск истоков работы нейросетей
Ученые разработали метод, позволяющий понять, как конкретные элементы больших языковых моделей (LLM) формируются в процессе обучения. Новая технология, названная Mechanistic Data Attribution (MDA), использует так называемые "функции влияния", чтобы определить, …