EigenData: автоматическая генерация данных для обучения AI с самообучением и RL
EigenData – это иерархический движок, который автоматически генерирует данные для обучения и проверяет их качество. Система способна создавать реалистичные диалоги, связанные с использованием различных инструментов, а также проверять правильность их выполнения. Ключевой особенностью является самообучение – система постоянно совершенствует процесс генерации данных, обновляя запросы и последовательность действий.
В основе обучения лежит метод обучения с подкреплением (RL), который сначала настраивает модель пользователя, а затем использует алгоритм GRPO для оптимизации обучения. Такой подход позволяет добиться стабильного улучшения результатов без необходимости в больших объемах данных, размеченных человеком.
На тесте tau^2-bench система показала 73% успешных решений в задачах, связанных с авиакомпаниями, и 98,3% в задачах телекоммуникаций, что сопоставимо или превосходит результаты существующих моделей.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.