Google выпустила Gemma 4 12B — 9 ГБ VRAM, производительность уровня 26B
Google официально представила новую модель Gemma 4 12B, которая работает локально на обычных ноутбуках с 16 ГБ памяти и почти дотягивается до производительности более крупной модели Gemma 4 26B-A4B из того же семейства.
Анонс: blog.google
Сообщество уже протестировало обе модели локально — результаты впечатляют. Давайте разберёмся, что к чему.
Тестирование на RTX 4090: физика в реальном времени
Обе модели запускались на одной RTX 4090 и получили одинаковое задание: написать самодостаточную HTML5 Canvas-анимацию с реальной физикой в одном файле, без сторонних библиотек.
Сцены для теста
- Доска Гальтона — симуляция распределения Гаусса через падающие шары
- Столкновение двух блоков с отскоком от стены — классическая упругая физика
- Хаотический тройной маятник — нелинейная динамика, чувствительная к начальным условиям
Результаты тестов Gemma
Gemma 4 26B-A4B
| Параметр | Значение |
|---|---|
| VRAM | 15 ГБ |
| Количество токенов | 6 900 |
| Скорость | 138 токенов/с |
| Активные параметры | 4 млрд |
Gemma 4 12B
| Параметр | Значение |
|---|---|
| VRAM | 9 ГБ |
| Количество токенов | 8 900 |
| Скорость | 80 токенов/с |
| Активные параметры | 12 млрд (плотная) |
Gemma 4 26B-A4B — абсолютный победитель по скорости
Несмотря на то что обе модели принадлежат к одному семейству Gemma 4, 26B-A4B выиграла во всех трёх физических сценах. Она работает примерно в 1.7 раза быстрее (138 против 80 токенов/с), используя всего 4 млрд активных параметров благодаря MoE-архитектуре. 15 ГБ VRAM — плата за производительность.
Gemma 4 12B — король эффективности
А вот 12B отстала совсем ненамного, но при этом потребляет почти вдвое меньше видеопамяти — всего 9 ГБ против 15 ГБ. Для ноутбуков с 16 ГБ VRAM это делает её одним из самых интересных вариантов для локального запуска.
Gemma 4 12B показывает производительность, близкую к более крупной 26B-модели, но при менее чем половине общего потребления памяти — Google.
Технические особенности Gemma 4
Мультимодальность
Gemma 4 12B — это не просто текстовая модель. Она поддерживает работу с изображениями и текстом одновременно, что открывает сценарии:
- Анализ изображений + генерация описаний
- Работа с документами и визуальными данными
- Агентные системы с мультимодальным вводом
Производительность на ноутбуках
Модель спроектирована так, чтобы работать локально на потребительских ноутбуках с 16 ГБ ОЗУ. Это ключевое отличие от облачных моделей — все вычисления на устройстве, приватность данных сохраняется, интернет не нужен.
Кому это интересно
- Разработчикам локальных AI-агентов — модель работает без интернета, приватность на максимуме
- Владельцам ноутбуков с 16 ГБ — наконец-то адекватная локальная модель
- Исследователям физики и симуляций — Gemma 4 отлично справляется с генерацией кода для физических сценариев
- Всем, кто устал платить за API — бесплатно, локально, open source
Google Gemma 4 12B — это идеальный баланс между производительностью и потреблением ресурсов. Да, 26B-A4B быстрее и мощнее. Но 12B потребляет почти вдвое меньше памяти и при этом показывает сопоставимые результаты. Для локального запуска на потребительском железе — это, пожалуй, лучший выбор на данный момент.
Скачивайте, тестируйте, форкайте.
Где скачать и как запустить
GGUF-версия
Готовая квантованная версия для локального запуска:
👉 huggingface.co/unsloth/gemma-4-12b-it-GGUF
Официальный гайд от Unsloth:
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru