ai research: generative models, unlearning, sim2real transfer

19 марта 2026 года вышло несколько новых исследований в области искусственного интеллекта.

Seasoning Generative Models for a Generalization Aftertaste

Использование дискриминаторов для обучения или тонкой настройки генеративных моделей оказалось довольно успешным подходом. Примером является Generative Adversarial Networks (GANs), которые минимизируют потери, возникающие при обучении дискриминаторов, а также другие парадигмы, которые улучшают генеративные модели посредством дискриминаторов, удовлетворяющих ограничениям слабых учащихся. Даже диффузионные модели показали преимущества с некоторыми видами дискриминаторной направляющей. В данной работе расширен результат сильной двойственности, связанный с $f$-дивергенциями, который приводит к рецепту, управляемому дискриминатором, позволяющему уточнить любую генеративную модель. Показано, что уточненные генеративные модели достоверно улучшают обобщение по сравнению с неуточненными. Анализ показывает, что разрыв в обобщении улучшается на основе сложности Радемахера набора дискриминаторов, используемых для уточнения. Этот рецепт включает в себя недавно представленный подход к диффузии на основе оценки (Kim et al., 2022), который показал большой эмпирический успех, но позволяет прояснить гарантии обобщения этого метода благодаря анализу. Работа обеспечивает теоретическое подтверждение существующей работы, предлагает направления для новых алгоритмов и способствует пониманию обобщения в генеративных моделях в целом.

A Concept is More Than a Word: Diversified Unlearning in Text-to-Image Diffusion Models

Концептуальное разучивание является многообещающим направлением для снижения рисков генерации вредоносного контента в диффузионных моделях преобразования текста в изображение, путем выборочного удаления нежелательных концепций из параметров модели. Существующие подходы обычно полагаются на ключевые слова для определения целевой концепции для разучивания. Однако показано, что этот подход, основанный на ключевых словах, имеет внутренние ограничения: визуальная концепция является многомерной, может быть выражена в различных текстовых формах и часто перекрывается с родственными концепциями в латентном пространстве, что делает разучивание, основанное только на ключевых словах, хрупким и склонным к чрезмерному забыванию. Это происходит, поскольку одно ключевое слово представляет только узкую точечную оценку концепции, не охватывая все ее семантическое распределение и запутанные вариации в латентном пространстве. Для решения этой проблемы предлагается "Diversified Unlearning" – распределенная структура, которая представляет концепцию через набор контекстуально разнообразных подсказок, а не через одно ключевое слово. Такое более богатое представление позволяет более точное и надежное разучивание. Эксперименты показали, что интеграция "Diversified Unlearning" в существующие конвейеры разучивания последовательно достигает более сильного стирания, лучшего сохранения несвязанных концепций и улучшенной устойчивости к атакам восстановления.

Ontology-Guided Diffusion for Zero-Shot Visual Sim2Real Transfer

Переход из симуляции в реальность (sim2real) остается сложной задачей из-за нехватки размеченных данных реального мира. Существующие подходы на основе диффузии полагаются на неструктурированные подсказки или статистическое выравнивание, которые не улавливают структурированные факторы, которые заставляют изображения выглядеть реально. Представлен "Ontology-Guided Diffusion" (OGD) – нейро-символический фреймворк для переноса изображения sim2real в режиме нулевого выстрела, который представляет реализм как структурированные знания. OGD разлагает реализм на онтологию интерпретируемых признаков, таких как освещение и свойства материала, и кодирует их взаимосвязи в графе знаний. Из синтетического изображения OGD выводит активацию признаков и использует графовую нейронную сеть для создания глобального внедрения. Параллельно символический планировщик использует онтологические признаки для вычисления последовательности визуальных изменений, необходимых для уменьшения разрыва между симуляцией и реальностью. Графовое внедрение обуславливает предварительно обученную диффузионную модель с инструктивным управлением посредством перекрестного внимания, а запланированные изменения преобразуются в структурированную инструкцию-подсказку. Графовые внедрения лучше различают реальные и синтетические изображения, а OGD превосходит современные методы диффузии в переносе изображений sim2real. OGD показывает, что явное кодирование структуры реализма обеспечивает интерпретируемый, эффективный и обобщаемый перенос sim2real в режиме нулевого выстрела.

HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning

Крупные языковые модели преуспевают в различных областях, но их производительность в сложных задачах принятия решений агентом с длинным горизонтом остается ограниченной. Большинство существующих методов сосредоточены на разработке эффективных моделей вознаграждения (RMs) для повышения производительности посредством многооборотного обучения с подкреплением. Однако они страдают от задержки распространения при разреженных вознаграждениях и ненадежного назначения кредитов при потенциально чрезмерно детализированных и нечетких вознаграждениях за отдельные ходы. Предложен HISR, использующий информацию о прошлом для модулирования сегментных вознаграждений процесса, который тесно сопоставляет вознаграждения с подцелями и подчеркивает значимые сегменты для повышения надежности назначения кредитов. Представлен сегментный RM для назначения вознаграждений за каждую подцель в задаче, избегая чрезмерно детального распределения по ходам. Для подчеркивания значимых сегментов в траектории разработана модель ретроспекции, отражающая предпочтение совершать определенное действие после знания результата траектории. Отношения последовательности вероятности между моделями ретроспекции и политики используются для измерения важности действия, которые затем используются для агрегирования баллов важности сегментов, что, в свою очередь, модулирует сегментные вознаграждения процесса, повышая надежность назначения кредитов. Эксперименты на трех общедоступных бенчмарках подтверждают валидность метода.

Revisiting Label Inference Attacks in Vertical Federated Learning: Why They Are Vulnerable and How to Defend

Вертикальное федеративное обучение (VFL) позволяет активной стороне с ведущей моделью и множеству пассивных сторон с нижними моделями сотрудничать. В этом сценарии пассивные стороны, обладающие только функциями, могут пытаться вывести частные метки активной стороны, что делает атаки вывода меток (LIAs) значительной угрозой. Предыдущие исследования LIA утверждали, что хорошо обученные нижние модели могут эффективно представлять метки. Однако показано, что это мнение вводит в заблуждение и раскрывает уязвимость существующих LIA. Используя взаимную информацию, представлено первое наблюдение феномена "компенсации модели" в VFL. Теоретически доказано, что во VFL взаимная информация между выходами слоев и метками увеличивается с глубиной слоя, что указывает на то, что нижние модели в первую очередь извлекают информацию о признаках, а верхняя модель обрабатывает сопоставление меток. На основе этого понимания предложено переназначение задач, чтобы показать, что успех существующих LIA на самом деле происходит из-за выравнивания распределения между признаками и метками. Когда это выравнивание нарушается, производительность LIA резко снижается или полностью выходит из строя. Также изучены последствия этого понимания для защиты. Предложена техника защиты с нулевыми накладными расходами, основанная на настройке слоя. Эксперименты на пяти наборах данных и пяти представительных архитектурах моделей показали, что смещение слоев обрезания вперед для увеличения пропорции верхних слоев модели во всей модели не только повышает устойчивость к LIA, но и улучшает другие защиты.

Words at Play: Benchmarking Audio Pun Understanding in Large Audio-Language Models

Каламбуры представляют собой типичное лингвистическое явление, которое использует полисемию и фонетическую неоднозначность для создания юмора, создавая уникальные проблемы для понимания естественного языка. В исследованиях каламбуров звук играет центральную роль в общении человека, за исключением текста и изображений, в то время как наборы данных и систематические ресурсы для звуковых каламбуров остаются скудными, оставляя эту важную модальность в значительной степени неизученной. Представлен APUN-Bench, первый эталонный тест для оценки больших аудио-языковых моделей (LALM) на понимание звуковых каламбуров. Эталонный тест содержит 4434 аудиопримера, аннотированных по трем этапам: распознавание каламбура, локализация слова каламбура и интерпретация значения каламбура. Проведен глубокий анализ APUN-Bench путем систематической оценки 10 современных LALM, выявляя существенные различия в производительности при распознавании, локализации и интерпретации звуковых каламбуров. Этот анализ выявляет ключевые проблемы, такие как позиционные предубеждения при локализации звуковых каламбуров и ошибки при интерпретации значений, предлагая практические рекомендации по развитию юмористического аудиоинтеллекта.

Seasoning Generative Models for a Generalization Aftertaste

A Concept is More Than a Word: Diversified Unlearning in Text-to-Image Diffusion Models

Ontology-Guided Diffusion for Zero-Shot Visual Sim2Real Transfer

HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning

Revisiting Label Inference Attacks in Vertical Federated Learning: Why They Are Vulnerable and How to Defend

Words at Play: Benchmarking Audio Pun Understanding in Large Audio-Language Models

Похожие новости

Новые исследования в области обработки естественного языка (nlp) в 2026 году

Синтетические данные для обучения моделей искусственного интеллекта

новые разработки в области искусственного интеллекта и машинного обучения

Ускорение исследований в области здравоохранения с помощью генеративного ИИ

ai research: repo launch, index of veracity & more

multiscale switch для полуконтролируемого обучения сегментации изображений