Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Heli

21.03.2026

LLM

0,0

159

gmt: целевой мультимодальный трансформер для 3d-траекторий

GMT: Целенаправленный мультимодальный трансформер для синтеза траекторий объектов в 3D-сценах

GMT – это мультимодальный трансформер, предназначенный для генерации реалистичных и ориентированных на цель траекторий движения объектов в 3D-средах. Модель использует …

Heli

21.03.2026

LLM

0,0

177

AI News: SkeletonLLM, AgentFactory & Lost Models

Universal Skeleton Understanding via Differentiable Rendering and MLLMs

18 марта 2026 года представлена работа Mengyuan Liu, Ziyi Wang, Peiming Li, Xinshun Wang, Yang Tang и ещё одного автора, посвященная универсальному …

Heli

21.03.2026

LLM

0,0

166

Создание модели встраивания для конкретной области за день

В этой статье описывается, как создать модель встраивания, специфичную для определенной области, менее чем за один день. Модель встраивания преобразует текст в вектор числовых значений, представляющий семантическое значение текста. Такие …

Heli

21.03.2026

LLM

0,0

268

nvidia выпустила nemotron-cascade 2 – moe модель и ещё 9 новости

nvidia выпустила nemotron-cascade 2 – moe модель

NVIDIA выпустила Nemotron-Cascade 2 – открытую модель Mixture of Experts (MoE) с 30 миллиардами параметров, при этом активных параметров – 3 миллиарда. Разработчики …

Heli

19.03.2026

LLM

0,0

178

представляем speed-bench: бенчмарк для спекулятивного декодирования

Представляем SPEED-Bench, унифицированный и разнообразный бенчмарк для спекулятивного декодирования. Спекулятивное декодирование — это многообещающая техника, призванная ускорить вывод больших языковых моделей, но ее оценка затруднена из-за отсутствия стандартизированных бенчмарков. SPEED-Bench …

Heli

19.03.2026

LLM

0,0

234

7 способов снизить галлюцинации в больших языковых моделях

Существует семь способов снизить галлюцинации в рабочих больших языковых моделях (LLM). Галлюцинации возникают, когда модель генерирует контент, который не основан на предоставленных входных данных или известных фактах.

Первый способ — …

Heli

19.03.2026

LLM

0,0

226

Пятиуровневая структура безопасности для автономных агентов llm и ещё 17 новости

Пятиуровневая структура безопасности для автономных агентов llm

Исследователи из Университета Цинхуа и Ant Group представили пятиуровневую структуру безопасности, ориентированную на жизненный цикл, для снижения уязвимостей автономных агентов LLM в OpenClaw.

…

Heli

18.03.2026

LLM

0,0

176

когда ИИ оценивает ИИ: скрытые опасности выравнивания

Когда ИИ оценивает ИИ: скрытые опасности моделей рассуждений в процессе выравнивания

Модели рассуждений, такие как языковые модели больших размеров (LLM), все чаще используются для оценки других ИИ, чтобы убедиться, что …

Heli

16.03.2026

LLM

0,0

236

Claw AI: безопасная альтернатива OpenClaw от Genspark и ещё 3 новости

Claw AI: безопасная альтернатива OpenClaw от Genspark

Genspark запустила ассистента Claw AI как безопасную альтернативу открытым платформам агентов, таким как OpenClaw. Claw AI позволяет предприятиям создавать и развертывать собственные агенты …

Heli

15.03.2026

LLM

0,0

235

langchain deep agents: продвинутые агенты для сложных задач

LangChain выпустила Deep Agents — структурированный механизм выполнения для планирования, памяти и изоляции контекста в многошаговых агентах ИИ. Deep Agents позволяют разработчикам создавать более надёжных и сложных агентов, которые могут …

Heli

15.03.2026

LLM

0,0

248

Безопасные конвейеры llm с outlines и pydantic и ещё 15 новости

Безопасные конвейеры llm с outlines и pydantic

В статье описывается способ создания безопасных, с ограничениями схем и управляемых функциями конвейеров больших языковых моделей (LLM) с использованием Outlines и Pydantic.

Использование …

Heli

14.03.2026

LLM

0,0

244

gstack: система разработки на основе claude от гарри тана

Гарри Тан выпустил gstack, систему для планирования, ревью кода, тестирования и релиза, основанную на Claude. Это open-source система.

gstack позволяет пользователям планировать, писать, тестировать и развертывать код с помощью Claude. …

Назад 1 ••• 8 9 10 11 12 13 14 ••• 16 Вперед