Новости ИИ

recent ai research: picosam3, commet, entransformer, and more

Heli
Автор
Heli
Опубликовано 15.03.2026
0,0
Views 9

PicoSAM3: Real-Time In-Sensor Region-of-Interest Segmentation

PicoSAM3 – это легковесная модель визуальной сегментации, предназначенная для работы на периферийных устройствах и в сенсорах, включая Sony IMX500. Модель имеет 1.3 миллиона параметров и сочетает в себе CNN-архитектуру с кодированием областей интереса, эффективное внимание к каналам и дистилляцию знаний из SAM2 и SAM3. На COCO и LVIS PicoSAM3 достигает 65.45% и 64.01% mIoU соответственно, превосходя существующие SAM-основанные и ориентированные на периферию базовые модели при аналогичной или меньшей сложности. INT8 квантованная модель сохраняет точность с незначительным ухудшением, обеспечивая в то же время в сенсорную инференцию в реальном времени с задержкой 11.82 мс на IMX500, полностью соответствуя требованиям к памяти и операторам.

CoMMET: To What Extent Can LLMs Perform Theory of Mind Tasks?

Представлен новый мультимодальный набор данных CoMMET, который расширяет оценку способности LLM рассуждать о ментальных состояниях других людей, предлагая многооборотное тестирование и охватывая широкий спектр ментальных состояний. Это первый мультимодальный набор данных для оценки ToM в многооборотном разговорном контексте. Исследование включает оценку LLM разных семейств и размеров, анализируя их сильные и слабые стороны.

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

EnTransformer – это глубокий генеративный фреймворк, объединяющий engression и Transformers для прогнозирования многомерных вероятностных временных рядов. Модель вводит стохастический шум и оптимизирует энергетическую оценку, напрямую изучая условное предиктивное распределение. EnTransformer генерирует согласованные траектории прогноза и эффективно моделирует временные зависимости и перекрестные связи между рядами. Эксперименты на различных бенчмарках показывают, что EnTransformer обеспечивает откалиброванные вероятностные прогнозы, превосходящие существующие модели.

Inverse Neural Operator for ODE Parameter Optimization

Предложен Inverse Neural Operator (INO) – двухэтажный фреймворк для восстановления скрытых параметров ODE из разреженных, частичных наблюдений. Первый этап включает Conditional Fourier Neural Operator (C-FNO) с кросс-вниманием, который реконструирует траектории ODE. Второй этап использует Amortized Drifting Model (ADM) для поиска параметров. INO превосходит градиентные и амортизированные базовые модели по точности и скорости.

The Landscape of Generative AI in Information Systems: A Synthesis of Secondary Reviews and Research Agendas

Исследование, основанное на систематическом обзоре литературы, показывает, что внедрение генеративного ИИ сопряжено с техническими, этическими и управленческими проблемами. Обнаружено несоответствие между быстрой эволюцией технологий GenAI и медленной адаптацией социальных систем. Предлагается исследовательская программа для совместного развития технических возможностей, организационных процедур, социальных ценностей и нормативных институтов.

PicoSAM3 CoMMET EnTransformer Inverse Neural Operator The Landscape of Generative AI PicoSAM3 PDF CoMMET PDF EnTransformer PDF Inverse Neural Operator PDF The Landscape of Generative AI PDF

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие новости