Swe-protégé: обучение маленьких llm с помощью эксперта
SWE-Protégé – это метод, позволяющий небольшим языковым моделям (LLM) выступать в качестве агентов для разработки программного обеспечения, за счет обучения выборочному сотрудничеству с экспертом. Исследователи разработали систему, в которой LLM, названную "ученик", совместно работает с большим LLM, выступающим в роли "наставника".
Система SWE-Protégé использует механизм, при котором "ученик" сначала пытается самостоятельно решить задачу по написанию кода. Если он сталкивается с трудностями, он обращается за помощью к "наставнику", предоставляя ему контекст и конкретные вопросы. "Наставник" предоставляет помощь, которая затем используется "учеником" для улучшения его решения.
Основная идея заключается в том, чтобы "ученик" научился выбирать, когда и какую помощь запрашивать у "наставника", а также как использовать полученную информацию. Этот процесс обучения основан на использовании данных, собранных при решении задач по разработке программного обеспечения.
Эксперименты показали, что SWE-Protégé позволяет небольшим языковым моделям достигать производительности, сопоставимой с более крупными моделями, при решении задач, связанных с разработкой программного обеспечения. Это открывает возможности для использования LLM меньшего размера в качестве эффективных агентов для автоматизации задач программирования.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru