Новости ИИ

Google выпустила Gemma 4 12B — 9 ГБ VRAM, производительность уровня 26B

Heli
Автор
Heli
Опубликовано 04.06.2026
0,0
Views 8

Google официально представила новую модель Gemma 4 12B, которая работает локально на обычных ноутбуках с 16 ГБ памяти и почти дотягивается до производительности более крупной модели Gemma 4 26B-A4B из того же семейства.

Анонс: blog.google

Сообщество уже протестировало обе модели локально — результаты впечатляют. Давайте разберёмся, что к чему.


Тестирование на RTX 4090: физика в реальном времени

Обе модели запускались на одной RTX 4090 и получили одинаковое задание: написать самодостаточную HTML5 Canvas-анимацию с реальной физикой в одном файле, без сторонних библиотек.

Сцены для теста

  • Доска Гальтона — симуляция распределения Гаусса через падающие шары
  • Столкновение двух блоков с отскоком от стены — классическая упругая физика
  • Хаотический тройной маятник — нелинейная динамика, чувствительная к начальным условиям

Результаты тестов Gemma

Gemma 4 26B-A4B

Параметр Значение
VRAM 15 ГБ
Количество токенов 6 900
Скорость 138 токенов/с
Активные параметры 4 млрд

Gemma 4 12B

Параметр Значение
VRAM 9 ГБ
Количество токенов 8 900
Скорость 80 токенов/с
Активные параметры 12 млрд (плотная)

Gemma 4 26B-A4B — абсолютный победитель по скорости

Несмотря на то что обе модели принадлежат к одному семейству Gemma 4, 26B-A4B выиграла во всех трёх физических сценах. Она работает примерно в 1.7 раза быстрее (138 против 80 токенов/с), используя всего 4 млрд активных параметров благодаря MoE-архитектуре. 15 ГБ VRAM — плата за производительность.

Gemma 4 12B — король эффективности

А вот 12B отстала совсем ненамного, но при этом потребляет почти вдвое меньше видеопамяти — всего 9 ГБ против 15 ГБ. Для ноутбуков с 16 ГБ VRAM это делает её одним из самых интересных вариантов для локального запуска.

Gemma 4 12B показывает производительность, близкую к более крупной 26B-модели, но при менее чем половине общего потребления памяти — Google.


Технические особенности Gemma 4

Мультимодальность

Gemma 4 12B — это не просто текстовая модель. Она поддерживает работу с изображениями и текстом одновременно, что открывает сценарии:

  • Анализ изображений + генерация описаний
  • Работа с документами и визуальными данными
  • Агентные системы с мультимодальным вводом

Производительность на ноутбуках

Модель спроектирована так, чтобы работать локально на потребительских ноутбуках с 16 ГБ ОЗУ. Это ключевое отличие от облачных моделей — все вычисления на устройстве, приватность данных сохраняется, интернет не нужен.


Кому это интересно

  • Разработчикам локальных AI-агентов — модель работает без интернета, приватность на максимуме
  • Владельцам ноутбуков с 16 ГБ — наконец-то адекватная локальная модель
  • Исследователям физики и симуляций — Gemma 4 отлично справляется с генерацией кода для физических сценариев
  • Всем, кто устал платить за API — бесплатно, локально, open source

Google Gemma 4 12B — это идеальный баланс между производительностью и потреблением ресурсов. Да, 26B-A4B быстрее и мощнее. Но 12B потребляет почти вдвое меньше памяти и при этом показывает сопоставимые результаты. Для локального запуска на потребительском железе — это, пожалуй, лучший выбор на данный момент.

Скачивайте, тестируйте, форкайте.


Где скачать и как запустить

GGUF-версия

Готовая квантованная версия для локального запуска:

👉 huggingface.co/unsloth/gemma-4-12b-it-GGUF

Официальный гайд от Unsloth:

👉 unsloth.ai/docs/models/gemma-4

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие новости