Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

27.02.2026

LLM
Star 0,0
Views 78

rlhfless: бессерверное обучение с подкреплением с обратной связью

RLHFless – это бессерверное вычисление для эффективного обучения с подкреплением с обратной связью от человека (RLHF). Традиционно, RLHF требует значительных вычислительных ресурсов и сложной инфраструктуры. RLHFless призван решить эти проблемы, …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 87

Ama-bench: новая платформа для оценки долговременной памяти агентов

AMA-Bench – это новая платформа для оценки долговременной памяти для агентских приложений. Она состоит из пяти сложных бенчмарков, охватывающих различные сценарии, такие как информационный поиск, ответы на вопросы, планирование и …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 88

MovieTeller: Автоматическое суммирование фильмов с помощью LLM

Авторы: Вэнтао Танг, Гаоанг Ванг, Ичжи Ли, Сяохань Чен, Мяо Цзян.

Абстракт В связи с бурным ростом цифровых развлечений, автоматическое суммирование видео стало незаменимым для таких приложений, как индексация контента, …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 73

Pgvms: Prompt-Guided Virtual Multiplex Ihc Staining

Иммуногистохимическое (IHC) окрашивание позволяет точно определять молекулярный профиль экспрессии белков, при этом в современной патологии доступно более 200 тестов на основе антител. Однако всесторонний анализ IHC часто ограничен недостаточным количеством …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 74

Sparta: New Benchmark for Table-Text QA and Cross-Modal Reasoning

Авторы: Sungho Park, Jueun Kim, Wook-Shin Han.

Abstract

Реальные задачи ответов на вопросы, использующие как таблицы, так и текст (Table-Text QA), требуют от моделей способности рассуждать, используя длинные тексты и …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 88

Иерархический планировщик на основе LLM для роботов

Планирование задач для нескольких роботов требует разложения инструкций на естественном языке в исполняемые действия для разнородных групп роботов. Традиционные планировщики, использующие язык определения доменов планирования (PDDL), обеспечивают строгие гарантии, но …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 87

TiMi: Многомодальные Transformer-модели для прогнозирования временных рядов

Прогнозирование временных рядов с использованием нескольких модальностей получило значительное внимание, поскольку обладает потенциалом для предоставления более точных прогнозов, чем традиционные модели, работающие с одной модальностью, за счет использования богатой информации, …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 139

LFM2-24B-A2B: Новая архитектура ИИ для периферийных устройств

Гонка в области генеративного ИИ долгое время была игрой в "больше - лучше". Но по мере того, как отрасль достигает пределов энергопотребления и узких мест в памяти, разговор смещается с …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 105

Explore-on-Graph: Новая архитектура для рассуждений LLM

Процесс рассуждений больших языковых моделей (LLM) часто страдает от галлюцинаций и отсутствия фактов при решении задач вопрос-ответ. Многообещающим решением является основание ответов LLM на верифицируемых источниках знаний, таких как графы …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 88

Архитектура запросов и рассуждения LLM: Задача автомойки

Большие языковые модели (LLM) постоянно терпят неудачу при решении так называемой «задачи автомойки» — популярного теста для оценки рассуждений, требующего неявного вывода физических ограничений. Мы провели исследование, направленное на определение …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 105

ExpLang: Многоязычное обучение с подкреплением для LLM

Современные большие языковые модели (LLM), прошедшие постобучение с использованием обучения с подкреплением (RL), демонстрируют значительные успехи в решении сложных задач. Однако предыдущие исследования в основном фокусировались на рассуждениях на английском …

Heli Verified

27.02.2026

LLM
Star 0,0
Views 101

ProactiveMobile: Новый бенчмарк для проактивного интеллекта в LLM

Мультимодальные большие языковые модели (MLLM) значительно продвинулись в разработке мобильных агентов, однако их возможности в основном ограничиваются реактивным подходом, когда они лишь выполняют явные команды пользователя. Новая парадигма – проактивный …