LLM

Autoagent: автоматическая разработка и оптимизация ai-агентов

Heli
Автор
Heli
Опубликовано 05.04.2026
0,0
Views 2

Встречайте «AutoAgent» — библиотеку с открытым исходным кодом, позволяющую ИИ-агентам разрабатывать и оптимизировать самих себя в течение ночи.

AutoAgent автоматизирует процесс итерации над агентами — изменяя системный промпт, инструменты, конфигурацию агента и оркестровку, запуская бенчмарк, проверяя оценку и повторяя процесс.

Библиотека имеет простую структуру: agent.py содержит всю систему под тестом, а program.md содержит инструкции для «мета-агента» — ИИ более высокого уровня, который выполняет изменения.

AutoAgent использует цикл «предложить — обучить — оценить», аналогичный autoresearch для обучения моделей машинного обучения, но оптимизирует «каркас» агента — системный промпт, определения инструментов и стратегию оркестровки.

Бенчмарки выражаются в формате Harbor, с использованием Docker для изоляции. Тесты могут использовать детерминированные проверки или LLM в качестве судьи для оценки правильности выходных данных агента.

Ключевые выводы: автономная разработка каркаса работает — AutoAgent показала себя лучше людей в проектировании агентов, достигнув #1 на SpreadsheetBench с результатом 96.5% и #1 GPT-5 на TerminalBench с результатом 55.1%. Мета-агент Claude, оптимизирующий агента Claude, показал более точную диагностику сбоев, чем при оптимизации агента на основе GPT, что указывает на важность парного моделирования. Роль человека меняется с инженера на директора — вы пишете program.md, а не agent.py. AutoAgent совместима с любым бенчмарком, использующим формат Harbor и работающим в Docker-контейнерах.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие новости