Swe-protégé: обучение маленьких llm с помощью эксперта

SWE-Protégé – это метод, позволяющий небольшим языковым моделям (LLM) выступать в качестве агентов для разработки программного обеспечения, за счет обучения выборочному сотрудничеству с экспертом. Исследователи разработали систему, в которой LLM, названную "ученик", совместно работает с большим LLM, выступающим в роли "наставника".

Система SWE-Protégé использует механизм, при котором "ученик" сначала пытается самостоятельно решить задачу по написанию кода. Если он сталкивается с трудностями, он обращается за помощью к "наставнику", предоставляя ему контекст и конкретные вопросы. "Наставник" предоставляет помощь, которая затем используется "учеником" для улучшения его решения.

Основная идея заключается в том, чтобы "ученик" научился выбирать, когда и какую помощь запрашивать у "наставника", а также как использовать полученную информацию. Этот процесс обучения основан на использовании данных, собранных при решении задач по разработке программного обеспечения.

Эксперименты показали, что SWE-Protégé позволяет небольшим языковым моделям достигать производительности, сопоставимой с более крупными моделями, при решении задач, связанных с разработкой программного обеспечения. Это открывает возможности для использования LLM меньшего размера в качестве эффективных агентов для автоматизации задач программирования.

НАВИГАЦИЯ

МЕНЮ

Swe-protégé: обучение маленьких llm с помощью эксперта

Похожие статьи

radar: рассуждение как дискриминация для llm

superglasses: оценка llm для умных очков

Механистическое отслеживание данных: поиск истоков работы нейросетей

agentsentry: защита от косвенной инъекции промптов в llm

Создание AI-агентов с памятью: кратковременной, долговременной и эпизодической

Что такое параметры в машинном обучении?