Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

27.02.2026

LLM
Star 0,0
Views 167

TiMi: Многомодальные Transformer-модели для прогнозирования временных рядов

Прогнозирование временных рядов с использованием нескольких модальностей получило значительное внимание, поскольку обладает потенциалом для предоставления более точных прогнозов, чем традиционные модели, работающие с одной модальностью, за счет использования богатой информации, …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 203

LFM2-24B-A2B: Новая архитектура ИИ для периферийных устройств

Гонка в области генеративного ИИ долгое время была игрой в "больше - лучше". Но по мере того, как отрасль достигает пределов энергопотребления и узких мест в памяти, разговор смещается с …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 175

Explore-on-Graph: Новая архитектура для рассуждений LLM

Процесс рассуждений больших языковых моделей (LLM) часто страдает от галлюцинаций и отсутствия фактов при решении задач вопрос-ответ. Многообещающим решением является основание ответов LLM на верифицируемых источниках знаний, таких как графы …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 155

Архитектура запросов и рассуждения LLM: Задача автомойки

Большие языковые модели (LLM) постоянно терпят неудачу при решении так называемой «задачи автомойки» — популярного теста для оценки рассуждений, требующего неявного вывода физических ограничений. Мы провели исследование, направленное на определение …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 162

ExpLang: Многоязычное обучение с подкреплением для LLM

Современные большие языковые модели (LLM), прошедшие постобучение с использованием обучения с подкреплением (RL), демонстрируют значительные успехи в решении сложных задач. Однако предыдущие исследования в основном фокусировались на рассуждениях на английском …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 158

ProactiveMobile: Новый бенчмарк для проактивного интеллекта в LLM

Мультимодальные большие языковые модели (MLLM) значительно продвинулись в разработке мобильных агентов, однако их возможности в основном ограничиваются реактивным подходом, когда они лишь выполняют явные команды пользователя. Новая парадигма – проактивный …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 150

Cxmp: Новый бенчмарк для оценки понимания языка LLM

Недавние исследования рассматривают языковые модели с лингвистической точки зрения, чтобы лучше понять, как они осваивают язык. Большинство существующих тестов сосредоточено на оценке грамматической правильности, в то время как способность интерпретировать …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 180

Универсальная Структура Для Безопасного RLHF

Обучение с подкреплением на основе обратной связи от человека (RLHF) играет важную роль в адаптации больших языковых моделей (LLM) к предпочтениям пользователей. Формулировка RLHF с ограничениями по ожидаемой награде как …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 169

Смесь Экспертов (MoE) в Трансформерах: Масштабирование и Эффективность

Модели трансформаторов совершили революцию в области обработки естественного языка, достигнув впечатляющих результатов в различных задачах. Однако их размер и вычислительные требования постоянно растут, что создает проблемы для обучения и развертывания. …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 174

Контекстное проектирование LLM: Когда 'помощь' вредит

В сфере разработки искусственного интеллекта "контекстное проектирование" стало новым подходом к повышению производительности больших языковых моделей (LLM). Специалисты индустрии активно используют файлы AGENTS.md (и аналогичные, например CLAUDE.md) как ключевую точку …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 263

LM Link: Бесшовная удалённая инференция LLM с помощью Tailscale

Для современного AI-разработчика продуктивность часто привязана к физическому местоположению. У вас, вероятно, есть мощный компьютер дома или в офисе, оснащённый видеокартами NVIDIA RTX, и более компактный ноутбук для работы в …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 182

Ускорение обучения LLM: новый метод от MIT и NVIDIA

Рассуждающие большие языковые модели (LLM) созданы для решения сложных задач, разбивая их на серию более мелких шагов. Эти мощные модели особенно хорошо справляются с задачами, требующими глубоких рассуждений, например, продвинутое …