ATOM отчет, пост-тренинг курс и текущие исследования в LLM
Вот что я разрабатываю: отчёт ATOM, пост-тренинговый курс, завершение моей книги и текущие исследования
Отчёт ATOM: измерение экосистемы открытых языковых моделей
В отчёте описываются мои и Флориана методы отслеживания открытой экосистемы, включая рост GPT-OSS, долю инференса на рынке, влияние китайских игроков среднего сегмента — Moonshot, Z.ai и MiniMax, а также признаки прогресса США в области открытых моделей. В частности, в статье детально изложены обновления относительной метрики внедрения (RAM), используемой для оценки внедрения недавних моделей с учётом времени и нормализации по размеру. Метрика RAM >1 означает, что модель на данный момент находится на пути попасть в топ-10 самых скачиваемых моделей своей категории за всё время. Также проанализированы ранние показатели внедрения модели Gemma 4.
Пост-тренинговый курс
Цель книги — стать основным ресурсом для перехода от новичка к эксперту в области пост-тренинга. Это не обязательно вводный курс, но по мере усиления моделей он становится важным элементом сообщества. Первым шагом расширения формата с книги на полноценный обучающий опыт стала лекционная серия. Лекции будут бесплатно доступны на YouTube и включать вопросы и ответы с сообществом.
Текущие исследования
Долгосрочные подписчики Interconnects знают, что этот блог зародился как объяснение фундаментальных исследований в области. В настоящее время я участвую в двух работах:
- TurnWise: The Gap between Single- and Multi-turn Language Model Capabilities, Graf et al. 2026 (https://arxiv.org/abs/2603.16759) — исследование многораундных диалоговых возможностей моделей, генерации обучающих данных для их улучшения и связанных задач.
- Meta-Reinforcement Learning with Self-Reflection for Agentic Search, Xiao et al. 2026 (https://arxiv.org/abs/2603.11327) — фреймворк применения метаобучения с саморефлексией к решению сложных задач с использованием RLVR.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru