Google выпустила Gemma 4 12B — 9 ГБ VRAM, производительность уровня 26B — Новости ИИ

Google официально представила новую модель Gemma 4 12B, которая работает локально на обычных ноутбуках с 16 ГБ памяти и почти дотягивается до производительности более крупной модели Gemma 4 26B-A4B из того же семейства.

Анонс: blog.google

Сообщество уже протестировало обе модели локально — результаты впечатляют. Давайте разберёмся, что к чему.

Тестирование на RTX 4090: физика в реальном времени

Обе модели запускались на одной RTX 4090 и получили одинаковое задание: написать самодостаточную HTML5 Canvas-анимацию с реальной физикой в одном файле, без сторонних библиотек.

Сцены для теста

Доска Гальтона — симуляция распределения Гаусса через падающие шары
Столкновение двух блоков с отскоком от стены — классическая упругая физика
Хаотический тройной маятник — нелинейная динамика, чувствительная к начальным условиям

Результаты тестов Gemma

Gemma 4 26B-A4B

Параметр	Значение
VRAM	15 ГБ
Количество токенов	6 900
Скорость	138 токенов/с
Активные параметры	4 млрд

Gemma 4 12B

Параметр	Значение
VRAM	9 ГБ
Количество токенов	8 900
Скорость	80 токенов/с
Активные параметры	12 млрд (плотная)

Gemma 4 26B-A4B — абсолютный победитель по скорости

Несмотря на то что обе модели принадлежат к одному семейству Gemma 4, 26B-A4B выиграла во всех трёх физических сценах. Она работает примерно в 1.7 раза быстрее (138 против 80 токенов/с), используя всего 4 млрд активных параметров благодаря MoE-архитектуре. 15 ГБ VRAM — плата за производительность.

Gemma 4 12B — король эффективности

А вот 12B отстала совсем ненамного, но при этом потребляет почти вдвое меньше видеопамяти — всего 9 ГБ против 15 ГБ. Для ноутбуков с 16 ГБ VRAM это делает её одним из самых интересных вариантов для локального запуска.

Gemma 4 12B показывает производительность, близкую к более крупной 26B-модели, но при менее чем половине общего потребления памяти — Google.

Технические особенности Gemma 4

Мультимодальность

Gemma 4 12B — это не просто текстовая модель. Она поддерживает работу с изображениями и текстом одновременно, что открывает сценарии:

Анализ изображений + генерация описаний
Работа с документами и визуальными данными
Агентные системы с мультимодальным вводом

Производительность на ноутбуках

Модель спроектирована так, чтобы работать локально на потребительских ноутбуках с 16 ГБ ОЗУ. Это ключевое отличие от облачных моделей — все вычисления на устройстве, приватность данных сохраняется, интернет не нужен.

Кому это интересно

Разработчикам локальных AI-агентов — модель работает без интернета, приватность на максимуме
Владельцам ноутбуков с 16 ГБ — наконец-то адекватная локальная модель
Исследователям физики и симуляций — Gemma 4 отлично справляется с генерацией кода для физических сценариев
Всем, кто устал платить за API — бесплатно, локально, open source

Google Gemma 4 12B — это идеальный баланс между производительностью и потреблением ресурсов. Да, 26B-A4B быстрее и мощнее. Но 12B потребляет почти вдвое меньше памяти и при этом показывает сопоставимые результаты. Для локального запуска на потребительском железе — это, пожалуй, лучший выбор на данный момент.

Скачивайте, тестируйте, форкайте.

Где скачать и как запустить

GGUF-версия

Готовая квантованная версия для локального запуска:

👉 huggingface.co/unsloth/gemma-4-12b-it-GGUF

Официальный гайд от Unsloth:

👉 unsloth.ai/docs/models/gemma-4

Google выпустила Gemma 4 12B — 9 ГБ VRAM, производительность уровня 26B

Тестирование на RTX 4090: физика в реальном времени

Результаты тестов Gemma

Технические особенности Gemma 4

Кому это интересно

Где скачать и как запустить

Похожие новости

Microsoft Research представляет CORPGEN для автономных AI-агентов и ещё 41 но...

ИИ-агенты для кодирования: контекст может навредить и ещё 16 новости

Meta AI представляет GCM для мониторинга GPU-кластеров и ещё 10 новости

google ai представляет gws cli для api workspace и ещё 17 новости

EditCtrl: Революция в редактировании видео с AI и ещё 11 новости

J-PAL запускает проект AI Evidence для проверки решений в борьбе с бедностью ...