AI Research: K-Gen, Risk Screening, SCoUT & Data Bias

5 марта 2026 года опубликованы несколько исследований.

K-Gen: Многомодальный подход для интерпретируемого формирования траектории

K-Gen — это интерпретируемый, основанный на ключевых точках, многомодальный фреймворк, использующий Multimodal Large Language Models (MLLMs) для объединения растровых входных данных BEV карты с текстовыми описаниями сцен. Вместо прямого предсказания траекторий, K-Gen генерирует интерпретируемые ключевые точки вместе с рассуждениями, отражающими намерения агента, которые затем уточняются в точные траектории модулем уточнения. Для дальнейшего улучшения генерации ключевых точек применяется T-DAPO, алгоритм обучения с подкреплением, учитывающий траекторию. Эксперименты на WOMD и nuPlan показали, что K-Gen превосходит существующие базовые решения, демонстрируя эффективность сочетания многомодального рассуждения и генерации траектории, управляемой ключевыми точками. K-Gen на Hugging Face PDF

Масштабируемый скрининг риска травм в бейсболе

Представлен конвейер на основе монокулярного видео, который восстанавливает 18 клинически значимых биомеханических показателей из телевизионных записей, позиционируя кинематику, полученную на основе позы, как масштабируемый источник моделирования риска травм. Подход основан на DreamPose3D и включает модуль глобального подъема с контролем дрейфа, который восстанавливает траекторию таза, а также конвейер уточнения кинематики для борьбы с размытием движения, артефактами сжатия и экстремальными бейсбольными позами. На 13 профессиональных питчерах (156 пар бросков) 16/18 показателей достигают субградусного соответствия (MAE < 1°). Использование этих показателей для прогнозирования травм, автоматизированная модель скрининга достигает AUC 0,811 для операции Томми Джона и 0,825 для серьезных травм руки на 7348 питчерах. Скрининг риска травм на Hugging Face PDF

SCoUT: Масштабируемая коммуникация в многоагентном обучении с подкреплением

SCoUT (Scalable Communication via Utility-guided Temporal grouping) решает проблемы обучения, когда и с кем общаться в MARL посредством временной и агентовой абстракции. Во время обучения SCoUT пересчитывает группы мягких агентов каждые (K) шагов среды (макро-шагов) с помощью Gumbel-Softmax, создавая латентные кластеры, которые индуцируют аффинность, используемую в качестве дифференцируемого априорного значения для получателей. Групповой критик прогнозирует значения для каждой группы агентов и отображает их в базовые значения для агента через те же мягкие назначения, уменьшая сложность и дисперсию критика. Каждый агент обучается с трехголовой политикой: действие среды, решение об отправке и выбор получателя. Для получения точных сигналов обучения коммуникации вычисляются контрфактические преимущества коммуникации, аналитически удаляя вклад каждого отправителя из агрегированных сообщений получателя. SCoUT: проектная страница SCoUT на Hugging Face PDF

Калибровка смещения отсутствующих данных в объяснениях атрибуции признаков

Представлен MCal, легковесный постобработочный метод, который корректирует смещение отсутствующих данных, путем тонкой настройки простого линейного слоя на выходах замороженной базовой модели. Исследование показывает, что смещение отсутствующих данных можно рассматривать как поверхностный артефакт выходного пространства модели и что данная простая коррекция последовательно уменьшает смещение и конкурирует с более сложными подходами в различных медицинских бенчмарках, охватывающих зрение, язык и табличные данные. MCal на Hugging Face PDF

K-Gen: Многомодальный подход для интерпретируемого формирования траектории

Масштабируемый скрининг риска травм в бейсболе

SCoUT: Масштабируемая коммуникация в многоагентном обучении с подкреплением

Калибровка смещения отсутствующих данных в объяснениях атрибуции признаков

Похожие новости

ai research updates: march 5, 2026

ai research: repo launch, index of veracity & more

timer-s1: модель для временных рядов

Новые исследования в области обработки естественного языка (nlp) в 2026 году

Automation Anywhere, EvolutIA Launch Enterprise AI Agents & More

ai agent modeling as personas and beyond