Статьи о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
01.03.2026
Sigma: генеративная система рекомендаций для AliExpress
SIGMA – это система рекомендаций для AliExpress, основанная на генеративном подходе и семантическом понимании инструкций. Она разработана для выполнения нескольких задач и позволяет создавать рекомендации, соответствующие потребностям пользователей.
Архитектура SIGMA
…
Heli
01.03.2026
Агентная самокоррекция: преодоление нежелания отвечать в llm
Агенты, основанные на больших языковых моделях (LLM), часто отказываются отвечать на вопросы, касающиеся чувствительной семантической информации. Это может быть связано с запрограммированными ограничениями или встроенными механизмами безопасности. В исследовании рассматривается …
Heli
01.03.2026
See it, say it, sorted: упрощение рассуждений в lvlm
Визуально-обоснованное многомодальное рассуждение в больших языковых моделях (LVLMs) обычно требует трудоемкого обучения. Представлен новый итеративный, без-обучающий фреймворк под названием "See It, Say It, Sorted", призванный упростить этот процесс.
Этот фреймворк …
Heli
01.03.2026
Улучшение многоязычных представлений посредством выравнивания
Улучшение многоязычных представлений посредством многостороннего выравнивания параллельных текстов
Многоязычные представления текста необходимы для многих задач обработки естественного языка, таких как межъязыковой поиск информации и машинный перевод. Существующие методы обычно полагаются …
Heli
01.03.2026
radar: рассуждение как дискриминация для llm
RADAR: Рассуждение как дискриминация с использованием выровненных представлений для рассуждений на основе графов знаний большими языковыми моделями (LLM).
Представлена новая модель RADAR, предназначенная для улучшения рассуждений на основе графов знаний …
Heli
01.03.2026
Swe-protégé: обучение маленьких llm с помощью эксперта
SWE-Protégé – это метод, позволяющий небольшим языковым моделям (LLM) выступать в качестве агентов для разработки программного обеспечения, за счет обучения выборочному сотрудничеству с экспертом. Исследователи разработали систему, в которой LLM, …
Heli
01.03.2026
superglasses: оценка llm для умных очков
Мы представляем SUPERGLASSES, первую комплексную платформу для оценки языковых моделей (LLM) как интеллектуальных агентов для умных очков с искусственным интеллектом. SUPERGLASSES сочетает в себе реалистичный симулятор окружающей среды, систему оценки …
Heli
01.03.2026
agentsentry: защита от косвенной инъекции промптов в llm
AgentSentry решает проблему косвенной инъекции промптов в агентах LLM за счет временной диагностике причинно-следственных связей и очистки контекста. Косвенная инъекция промптов возникает, когда вредоносные инструкции внедряются в источники данных, к …