Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
11.03.2026
Запустите ai модель преобразования речи в речь локально
Запустите модель искусственного интеллекта для преобразования речи в речь в реальном времени локально.
Вы можете запустить модель преобразования речи в речь в реальном времени на своем компьютере, используя Whisper от …
Heli
11.03.2026
Создание самопроектирующего мета-агента с помощью llm
Создание самопроектирующего мета-агента, который автоматически конструирует, воплощает и улучшает ИИ-агентов, предназначенных для конкретных задач, становится возможным благодаря развитию больших языковых моделей (LLM). Этот процесс включает в себя несколько этапов. Сначала …
Heli
11.03.2026
nvidia представляет nemotron-terminal для масштабирования llm-агентов
NVIDIA выпустила Nemotron-Terminal – систематический конвейер разработки данных для масштабирования LLM-агентов терминала.
Nemotron-Terminal - это набор инструментов, предназначенный для создания и масштабирования агентов, работающих в терминале и использующих большие языковые …
Heli
10.03.2026
marvn.ai: не просто чат-бот, а платформа для создания агентов
marvn.ai не "очередной чат-бот", и в этом вся суть.
marvn.ai — это агент, который позволяет пользователям создавать, развертывать и масштабировать собственные экземпляры модели marvn, а также подключать их к своим …
Heli
10.03.2026
ulysses: параллелизм последовательностей для больших языковых моделей
Мы представляем Ulysses, новый метод параллелизма последовательностей, который позволяет обучать большие языковые модели (LLM) с контекстами в миллион токенов. Ulysses решает проблему, когда длительные последовательности не помещаются в память GPU, …
Heli
10.03.2026
context hub: новый инструмент для кодирующих агентов от эндрю нга и ещё 12 но...
context hub: новый инструмент для кодирующих агентов от эндрю нга
Команда Эндрю Нга выпустила Context Hub – инструмент с открытым исходным кодом, который предоставляет кодирующему агенту необходимые актуальные документы API. …
Heli
09.03.2026
Языковые модели становятся доступнее: снижение цен и рост конкуренции
Языковые модели становятся товаром. В последние месяцы наблюдается значительный рост числа с открытым исходным кодом и коммерческих языковых моделей. Это привело к снижению цен и увеличению доступности.
Растущий рынок
На …
Heli
08.03.2026
multilevel training for kolmogorov arnold networks
Multilevel Training for Kolmogorov Arnold Networks
5 марта 2026 года была представлена работа 2603.04827, авторы Ben S. Southworth, Jonas A. Actor, Graham Harper и Eric C. Cyr. Авторы утверждают, что …
Heli
08.03.2026
Адаптивное прототипное интерпретируемое градирование рака простаты
Адаптивное прототипное интерпретируемое градирование рака простаты
Адаптивное прототипное интерпретируемое градирование рака простаты было представлено 5 марта 2026 года, авторы — Сушмита Митра, Риддхасри Бхаттачарья, Паллаби Дутта. Рак простаты является одним …
Heli
08.03.2026
waterSIC и ∇-reasoner: новые достижения в LLM
WaterSIC рассматривает задачу преобразования плотного линейного слоя в низкоточный. Торговый баланс между длиной сжатия и расхождением выходных данных анализируется с точки зрения теории информации (IT). Показано, что популярный алгоритм GPTQ …
Heli
08.03.2026
создание агентного ИИ нового поколения: полный фреймворк
Создание агентного ИИ нового поколения: полный фреймворк для когнитивных агентов, управляемых проектом во время выполнения с инструментами памяти и валидации.
Агенты нового поколения требуют фреймворка, который охватывает все аспекты их …
Heli
07.03.2026
Ансамблирование языковых моделей и новые подходы к har
Ансамблирование языковых моделей с помощью последовательного Монте-Карло
5 марта 2026 года исследователи Jacob Hoover Vigly, Timothy J. O'Donnell, Ryan Cotterell, Tim Vieira, Robin Shing Moon Chan и другие представили работу, …