ai research: repo launch, index of veracity & more
5 марта 2026 года появились несколько новых исследований и разработок в области искусственного интеллекта и машинного обучения.
RepoLaunch: Автоматизация конвейера сборки и тестирования
Представлен RepoLaunch, агент, способный автоматически разрешать зависимости, компилировать исходный код и извлекать результаты тестирования для репозиториев на любых языках программирования и операционных системах. Он автоматизирует создание наборов данных для обучения кодирующих агентов и больших языковых моделей, где единственное ручное вмешательство заключается в разработке задач. Несколько работ по агентскому тестированию и обучению уже используют RepoLaunch для автоматической генерации задач.
Измерение хрупкости доверия: разработка индекса достоверности
Внедрен индекс достоверности (CIES), который измеряет устойчивость объяснений моделей искусственного интеллекта к реалистичным возмущениям данных. CIES оценивает, остаются ли причины, лежащие в основе прогноза, неизменными, а не только сам прогноз. Индекс использует взвешенную по рангу функцию расстояния, которая непропорционально штрафует нестабильность в наиболее важных признаках. Результаты показывают, что сложность модели влияет на достоверность объяснений, а балансировка классов посредством SMOTE влияет как на производительность, так и на стабильность объяснений.
Легкий и масштабируемый фреймворк для переноса обучения в задачах разделения нагрузки
Предложен RefQuery, масштабируемый многозадачный фреймворк для мониторинга нагрузки, который позволяет одной модели обслуживать множество устройств, используя компактные отпечатки устройств. RefQuery замораживает предварительно обученную сеть и адаптируется к новым данным, изучая только векторное представление для каждого устройства. Эксперименты на трех общедоступных наборах данных показали, что RefQuery обеспечивает сильный компромисс между точностью и эффективностью.
Обучение для технологий: внедрение и продуктивное использование генеративного ИИ в юридическом анализе
Исследование показало, что целевое обучение пользователей может повысить продуктивность генеративного искусственного интеллекта в профессиональной среде. Рандомизированное исследование с участием 164 студентов-юристов показало, что обучение увеличило использование больших языковых моделей с 26% до 41% и улучшило результаты экзамена на 0,27 балла. Доступ к ИИ без обучения не улучшил результаты и был связан с более короткими ответами.
Простой базовый уровень для объединения понимания, генерации и редактирования
Представлен Wallaroo, простой авторегрессивный базовый уровень, который использует предсказание следующего токена для объединения многомодального понимания, генерации изображений и редактирования. Wallaroo поддерживает многоразрешающий ввод и вывод изображений, а также двуязычную поддержку китайского и английского языков. Использовалась стратегия обучения в четыре этапа. Эксперименты показали, что Wallaroo демонстрирует конкурентоспособные результаты.
View on Hugging Face Read PDF ArXiv https://github.com/JiePKU/Wallaroo
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru