Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Heli

03.03.2026

LLM

0,0

226

alibaba qwen 3.5 small: новые модели для устройств и ещё 6 новости

alibaba qwen 3.5 small: новые модели для устройств

Компания Alibaba выпустила семейство моделей Qwen 3.5 Small, состоящее из моделей с количеством параметров от 0.8 миллиарда до 9 миллиардов. Эти модели …

Heli

01.03.2026

LLM

0,0

237

Alibaba представляет CoPaw: рабочая станция персональных агентов и SoPE: Пози...

Alibaba представляет CoPaw: рабочая станция персональных агентов

Команда Alibaba открыла исходный код CoPaw, высокопроизводительной рабочей станции персонального агента для разработчиков, предназначенной для масштабирования многоканальных рабочих процессов искусственного интеллекта и памяти. …

Heli

28.02.2026

LLM

0,0

236

применение больших языковых моделей в оценке жизненного цикла

Использование больших языковых моделей (БЯМ) в оценке жизненного цикла (ОЖЖ) открывает новые возможности для автоматизации и повышения эффективности. Исследование посвящено анализу текущего состояния применения ИИ в ОЖЖ с использованием БЯМ, …

Heli

28.02.2026

LLM

0,0

235

Редкое редактирование весов для безопасных многоязычных llm

Выравнивание безопасности многоязычных моделей — сложная задача, поскольку стратегии, эффективные для одного языка, могут не переноситься на другие. В данной работе мы представляем новый метод выравнивания безопасности, использующий редкое редактирование …

Heli

28.02.2026

LLM

0,0

194

Эффективность стратегии в математическом рассуждении с помощью llm

Эффективность стратегии в математическом рассуждении: использование различий между человеком и моделью для эффективного руководства.

В математическом рассуждении, где стратегии часто неявны и трудно передаются, возникают проблемы с выполнением стратегий. Чтобы …

Heli

28.02.2026

LLM

0,0

226

Редактирование изображений по инструкции с помощью llm и диффузионных моделей

Редактирование изображений на основе инструкций – сложная задача, требующая не только понимания инструкций, но и планирования, рассуждений и генерации, чтобы обеспечить реалистичные и последовательные изменения. В этой работе мы представляем …

Heli

27.02.2026

LLM

0,0

196

rlhfless: бессерверное обучение с подкреплением с обратной связью

RLHFless – это бессерверное вычисление для эффективного обучения с подкреплением с обратной связью от человека (RLHF). Традиционно, RLHF требует значительных вычислительных ресурсов и сложной инфраструктуры. RLHFless призван решить эти проблемы, …

Heli

27.02.2026

LLM

0,0

186

Ama-bench: новая платформа для оценки долговременной памяти агентов

AMA-Bench – это новая платформа для оценки долговременной памяти для агентских приложений. Она состоит из пяти сложных бенчмарков, охватывающих различные сценарии, такие как информационный поиск, ответы на вопросы, планирование и …

Heli

27.02.2026

LLM

0,0

189

MovieTeller: Автоматическое суммирование фильмов с помощью LLM

Авторы: Вэнтао Танг, Гаоанг Ванг, Ичжи Ли, Сяохань Чен, Мяо Цзян.

Абстракт В связи с бурным ростом цифровых развлечений, автоматическое суммирование видео стало незаменимым для таких приложений, как индексация контента, …

Heli

27.02.2026

LLM

0,0

173

Pgvms: Prompt-Guided Virtual Multiplex Ihc Staining

Иммуногистохимическое (IHC) окрашивание позволяет точно определять молекулярный профиль экспрессии белков, при этом в современной патологии доступно более 200 тестов на основе антител. Однако всесторонний анализ IHC часто ограничен недостаточным количеством …

Heli

27.02.2026

LLM

0,0

174

Sparta: New Benchmark for Table-Text QA and Cross-Modal Reasoning

Авторы: Sungho Park, Jueun Kim, Wook-Shin Han.

Abstract

Реальные задачи ответов на вопросы, использующие как таблицы, так и текст (Table-Text QA), требуют от моделей способности рассуждать, используя длинные тексты и …

Heli

27.02.2026

LLM

0,0

197

Иерархический планировщик на основе LLM для роботов

Планирование задач для нескольких роботов требует разложения инструкций на естественном языке в исполняемые действия для разнородных групп роботов. Традиционные планировщики, использующие язык определения доменов планирования (PDDL), обеспечивают строгие гарантии, но …

Назад 1 ••• 11 12 13 14 15 16 Вперед