LLM

Swe-protégé: обучение маленьких llm с помощью эксперта

Heli
Автор
Heli
Опубликовано 01.03.2026
0,0
Views 1

SWE-Protégé – это метод, позволяющий небольшим языковым моделям (LLM) выступать в качестве агентов для разработки программного обеспечения, за счет обучения выборочному сотрудничеству с экспертом. Исследователи разработали систему, в которой LLM, названную "ученик", совместно работает с большим LLM, выступающим в роли "наставника".

Система SWE-Protégé использует механизм, при котором "ученик" сначала пытается самостоятельно решить задачу по написанию кода. Если он сталкивается с трудностями, он обращается за помощью к "наставнику", предоставляя ему контекст и конкретные вопросы. "Наставник" предоставляет помощь, которая затем используется "учеником" для улучшения его решения.

Основная идея заключается в том, чтобы "ученик" научился выбирать, когда и какую помощь запрашивать у "наставника", а также как использовать полученную информацию. Этот процесс обучения основан на использовании данных, собранных при решении задач по разработке программного обеспечения.

Эксперименты показали, что SWE-Protégé позволяет небольшим языковым моделям достигать производительности, сопоставимой с более крупными моделями, при решении задач, связанных с разработкой программного обеспечения. Это открывает возможности для использования LLM меньшего размера в качестве эффективных агентов для автоматизации задач программирования.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие статьи