MiniMax M3: открытая мультимодальная модель с контекстом 1M токенов
Китайская AI-лаборатория MiniMax представила M3 — первую открытую модель, объединяющую frontier-уровень программирования, контекстное окно в миллион токенов и нативную мультимодальность. Релиз состоялся 1 июня 2026 года, API уже доступен через OpenAI-совместимый интерфейс, а веса модели и технический отчет обещают опубликовать на HuggingFace и GitHub в течение десяти дней.
Архитектура и технические характеристики
MiniMax Sparse Attention (MSA)
Ключевая особенность M3 — собственная архитектура внимания MiniMax Sparse Attention (MSA), которая обеспечивает работу с контекстным окном до 1 миллиона токенов при гарантированном минимуме в 512 тысяч токенов высококачественной обработки.
Такой объем контекста критически важен для нескольких сценариев:
Длительные агентные сессии
Модель может работать часами и даже сутками без потери контекста, накапливая историю действий, ошибок и решений.
Работа с большими кодовыми базами
Возможность загрузить в контекст целые репозитории для комплексного анализа и рефакторинга.
Анализ длинных видео
Обработка видеоконтента большой продолжительности с сохранением деталей на всем протяжении.
Архитектура MSA специально оптимизирована для решения проблемы «убийцы латентности» в агентных циклах — массивного повторного заполнения префикса при каждом новом запросе.
Нативная мультимодальность
В отличие от многих конкурентов, где мультимодальность добавляется поверх готовой языковой модели, M3 обучалась работать с текстом, изображениями и видео как с единым целым с самого начала. Это обеспечивает более естественное понимание связей между модальностями и лучшее качество на задачах, требующих кроссмодального рассуждения.
Производительность на бенчмарках
MiniMax M3 демонстрирует результаты, сопоставимые с ведущими закрытыми моделями на специализированных задачах.
Программирование
SWE-Bench Pro: 59,0%
Бенчмарк проверяет способность решать реальные задачи из GitHub-репозиториев. M3 превзошла GPT-5.5 и Gemini 3.1 Pro, хотя и уступила Claude Opus 4.7.
Terminal Bench 2.1: 66,0%
Тест на выполнение команд в терминале показывает высокую компетентность модели в работе с командной строкой и системными инструментами.
Автономные агенты
BrowseComp: 83,5%
Самый впечатляющий результат M3. Этот бенчмарк из 1,266 вопросов проверяет способность AI-агентов автономно перемещаться по интернету в поисках сложной, запутанной информации. M3 опережает Claude Opus 4.7 (79,3%), демонстрируя превосходную настойчивость в сборе информации и креативность в веб-навигации.
MCP Atlas: 74,2%
Набор задач на использование инструментов и протоколов взаимодействия.
BankerToolBench: 76,1%
Проверка способности работать с финансовыми инструментами и данными.
Области для улучшения
На некоторых бенчмарках, таких как KernelBench Hard, M3 все еще уступает топовым закрытым моделям. Также стоит отметить, что часть результатов была получена на инфраструктуре MiniMax с собственным агентным scaffolding, поэтому независимая верификация еще ожидается.
Практические кейсы из технического отчета
MiniMax приводит несколько впечатляющих примеров автономной работы M3 на длинных задачах.
Воспроизведение научной статьи
M3 получила задачу самостоятельно воспроизвести результаты научной статьи с конференции ICLR 2025. Модель:
- Работала почти 12 часов без вмешательства человека
- Выполнила 18 коммитов в репозитории
- Построила 23 экспериментальных графика
- Успешно повторила ключевые эксперименты из статьи
Этот кейс демонстрирует способность модели к длительной автономной работе с научными данными, понимание методологии исследований и способность к самостоятельной организации рабочего процесса.
Оптимизация вычислительного ядра для GPU
В другом тесте M3 поручили оптимизировать производительность вычислительного ядра для GPU NVIDIA. За примерно сутки работы модель:
- Выполнила 147 итераций оптимизации
- Сделала почти 2000 вызовов инструментов
- Подняла загрузку GPU с 7,6% до 71,3%
- Ускорила работу в 9,4 раза
Это особенно впечатляет, учитывая сложность оптимизации низкоуровневого кода для GPU — задачи, требующей глубокого понимания архитектуры оборудования, профилирования и итеративного тестирования.
PostTrainBench: обучение других моделей
На бенчмарке PostTrainBench, где модель должна самостоятельно обучить другие модели, M3 заняла третье место, уступив только Claude Opus 4.7 и GPT-5.5. Это указывает на способность модели к мета-обучению и пониманию принципов машинного обучения на практическом уровне.
Доступность и цены
API
API M3 доступен через OpenAI-совместимый интерфейс, что минимизирует трудности интеграции для существующих проектов.
Стандартные цены (до 512K токенов): - Входные токены: $0,60 за миллион - Выходные токены: $2,40 за миллион
Промо-цены (первые 7 дней, скидка 50%): - Входные токены: $0,30 за миллион - Выходные токены: $1,20 за миллион
Это делает M3 одной из самых доступных моделей с таким уровнем возможностей и размером контекстного окна.
Открытые веса
MiniMax обещает выложить веса модели и полный технический отчет на HuggingFace и GitHub в течение примерно десяти дней после анонса. Это позволит исследователям и разработчикам:
- Запускать модель на собственной инфраструктуре
- Проводить независимые бенчмарки
- Дообучать модель для специализированных задач
- Изучать архитектурные решения MSA
Агентная среда MiniMax Code
Компания также предоставляет собственную агентную среду MiniMax Code, оптимизированную для работы с M3 на задачах программирования и автономной разработки.
Значение для индустрии
Релиз M3 важен по нескольким причинам:
Демократизация frontier-возможностей
Впервые комбинация топового программирования, миллионного контекста и нативной мультимодальности становится доступной в открытых весах.
Конкуренция с закрытыми моделями
M3 показывает, что китайские лаборатории способны создавать модели, конкурирующие с лучшими западными решениями, особенно на специализированных задачах.
Фокус на агентные применения
Архитектурные решения M3 четко ориентированы на будущее AI-агентов, способных к длительной автономной работе.
Доступная цена
При значительно более низкой стоимости, чем у конкурентов, M3 может стать выбором для стартапов и исследовательских проектов с ограниченным бюджетом.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru