google deepmind alphaevolve: новая модель для разработки алгоритмов

Автор

Heli

Опубликовано 04.04.2026

0,0

Исследование Google DeepMind позволило большой языковой модели (LLM) переписывать собственные алгоритмы теории игр. Система под названием AlphaEvolve обнаружила новые варианты алгоритмов, которые работают на уровне или лучше существующих. В частности, были разработаны VAD-CFR и SHOR-PSRO.

Исследователи применили эту технологию к Counterfactual Regret Minimization (CFR) и Policy Space Response Oracles (PSRO). В обоих случаях система нашла новые варианты алгоритмов, которые конкурируют или превосходят существующие. Все эксперименты проводились с использованием OpenSpiel framework.

В игре 3-player Kuhn Poker, 2-player Leduc Poker, 4-card Goofspiel, и 5-sided Liars Dice VAD-CFR превзошла существующие алгоритмы в 10 из 11 игр.

В другом эксперименте была создана модель Asymmetric Optimistic Discounted CFR (AOD-CFR). Также была разработана модель Smoothed Hybrid Optimistic Regret PSRO (SHOR-PSRO) которая показала хорошие результаты в 8 из 11 игр.

AlphaEvolve автоматизирует процесс проектирования алгоритмов, используя Gemini 2.5 Pro для мутации исходного кода. Исследование показывает, что LLM могут быть полезным инструментом для решения сложных задач и создания новых алгоритмов.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Похожие новости

google deepmind alphaevolve: новая модель для разработки алгоритмов

Похожие новости

Пятиуровневая структура безопасности для автономных агентов llm и ещё 17 новости

Будущее искусственного интеллекта и науки и ещё 12 новости

Саморазвивающаяся система навыков на основе openspace и ещё 16 новости

Безопасные конвейеры llm с outlines и pydantic и ещё 15 новости

alibaba qwen 3.5 small: новые модели для устройств и ещё 6 новости

Создание ai-агента для веба с помощью molmo web-4b и ещё 8 новости