ai research: repo launch, index of veracity & more

5 марта 2026 года появились несколько новых исследований и разработок в области искусственного интеллекта и машинного обучения.

RepoLaunch: Автоматизация конвейера сборки и тестирования

Представлен RepoLaunch, агент, способный автоматически разрешать зависимости, компилировать исходный код и извлекать результаты тестирования для репозиториев на любых языках программирования и операционных системах. Он автоматизирует создание наборов данных для обучения кодирующих агентов и больших языковых моделей, где единственное ручное вмешательство заключается в разработке задач. Несколько работ по агентскому тестированию и обучению уже используют RepoLaunch для автоматической генерации задач.

Измерение хрупкости доверия: разработка индекса достоверности

Внедрен индекс достоверности (CIES), который измеряет устойчивость объяснений моделей искусственного интеллекта к реалистичным возмущениям данных. CIES оценивает, остаются ли причины, лежащие в основе прогноза, неизменными, а не только сам прогноз. Индекс использует взвешенную по рангу функцию расстояния, которая непропорционально штрафует нестабильность в наиболее важных признаках. Результаты показывают, что сложность модели влияет на достоверность объяснений, а балансировка классов посредством SMOTE влияет как на производительность, так и на стабильность объяснений.

Легкий и масштабируемый фреймворк для переноса обучения в задачах разделения нагрузки

Предложен RefQuery, масштабируемый многозадачный фреймворк для мониторинга нагрузки, который позволяет одной модели обслуживать множество устройств, используя компактные отпечатки устройств. RefQuery замораживает предварительно обученную сеть и адаптируется к новым данным, изучая только векторное представление для каждого устройства. Эксперименты на трех общедоступных наборах данных показали, что RefQuery обеспечивает сильный компромисс между точностью и эффективностью.

Обучение для технологий: внедрение и продуктивное использование генеративного ИИ в юридическом анализе

Исследование показало, что целевое обучение пользователей может повысить продуктивность генеративного искусственного интеллекта в профессиональной среде. Рандомизированное исследование с участием 164 студентов-юристов показало, что обучение увеличило использование больших языковых моделей с 26% до 41% и улучшило результаты экзамена на 0,27 балла. Доступ к ИИ без обучения не улучшил результаты и был связан с более короткими ответами.

Простой базовый уровень для объединения понимания, генерации и редактирования

Представлен Wallaroo, простой авторегрессивный базовый уровень, который использует предсказание следующего токена для объединения многомодального понимания, генерации изображений и редактирования. Wallaroo поддерживает многоразрешающий ввод и вывод изображений, а также двуязычную поддержку китайского и английского языков. Использовалась стратегия обучения в четыре этапа. Эксперименты показали, что Wallaroo демонстрирует конкурентоспособные результаты.

View on Hugging Face Read PDF ArXiv https://github.com/JiePKU/Wallaroo

RepoLaunch: Автоматизация конвейера сборки и тестирования

Измерение хрупкости доверия: разработка индекса достоверности

Легкий и масштабируемый фреймворк для переноса обучения в задачах разделения нагрузки

Обучение для технологий: внедрение и продуктивное использование генеративного ИИ в юридическом анализе

Простой базовый уровень для объединения понимания, генерации и редактирования

Похожие новости

новые разработки в области искусственного интеллекта и машинного обучения

Новые исследования в области обработки естественного языка (nlp) в 2026 году

Automation Anywhere, EvolutIA Launch Enterprise AI Agents & More

Google лидирует в генерации изображений AI: Nano Banana 2 и другие новости

Perplexity Computer, AI-агенты и новости ИИ

Axios и ИИ в журналистике: оптимизация новостного процесса