Google DeepMind: AlphaEvolve создает новые алгоритмы ИИ
Исследователи Google DeepMind представили AlphaEvolve – систему, использующую большие языковые модели (LLM) для автоматического создания новых алгоритмов машинного обучения. AlphaEvolve рассматривает исходный код как "геном" и способна не просто настраивать параметры, а изобретать новую логику.
В основе AlphaEvolve лежит "семантическая эволюция", где LLM (Gemini 2.5 pro) вносит изменения в код, стремясь уменьшить уязвимости алгоритмов. Процесс включает в себя инициализацию, мутацию кода, автоматическую оценку на упрощенных играх и выбор лучших кандидатов для дальнейшего улучшения.
В результате работы AlphaEvolve были созданы два новых алгоритма: VAD-CFR и SHOR-PSRO. VAD-CFR (Volatility-Adaptive Discounted CFR) адаптируется к изменчивости игрового процесса, используя механизм взвешенного усреднения для быстрого забывания нестабильной информации и удержания важной истории. SHOR-PSRO (Smoothed Hybrid Optimistic Regret PSRO) использует гибридный подход, сочетая стабильность с агрессивным поиском оптимальных стратегий.
Оба алгоритма показали высокие результаты в тестах, превзойдя существующие решения в большинстве игровых сценариев.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru