StepFun — Step-DeepResearch (Qwen2.5 32B): агент для глубинных исследований
StepFun выпустила Step-DeepResearch - агент на 32 миллиардах параметров, который пытается делать нормальные исследования вместо обычного поиска. Взяли Qwen2.5 32B и научили планировать, искать инфу, проверять факты и писать отчеты.
Обычные веб-агенты ищут короткие ответы на вопросы. Тут другая история - модель разбивает задачу на части, лазит по источникам, перепроверяет данные и собирает всё в структурированный отчет с ссылками.
Обучали в три этапа. Сначала базовые возможности без инструментов, потом добавили вызовы API и увеличили контекст до 128 тысяч токенов, в конце дообучили через reinforcement learning с оценкой качества отчетов.
Во время работы агент использует ReAct-паттерн - думает, вызывает инструменты, смотрит на результат, думает дальше. Есть поиск, менеджер задач, работа с файлами. Поисковая база - 20+ миллионов статей и отфильтрованные надежные домены.
На Scale AI Research Rubrics выдает 61% соответствия критериям, примерно как у OpenAI и Gemini. На китайском бенчмарке ADR-Bench обходит открытые модели покрупнее.
Модель на 32B параметров справляется с задачами для которых обычно нужны гораздо более тяжелые системы. Подходит для техобзоров, аналитики, проверки фактов там, где надо не просто нагуглить, а разобраться в теме.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru