recent ai research: picosam3, commet, entransformer, and more
PicoSAM3: Real-Time In-Sensor Region-of-Interest Segmentation
PicoSAM3 – это легковесная модель визуальной сегментации, предназначенная для работы на периферийных устройствах и в сенсорах, включая Sony IMX500. Модель имеет 1.3 миллиона параметров и сочетает в себе CNN-архитектуру с кодированием областей интереса, эффективное внимание к каналам и дистилляцию знаний из SAM2 и SAM3. На COCO и LVIS PicoSAM3 достигает 65.45% и 64.01% mIoU соответственно, превосходя существующие SAM-основанные и ориентированные на периферию базовые модели при аналогичной или меньшей сложности. INT8 квантованная модель сохраняет точность с незначительным ухудшением, обеспечивая в то же время в сенсорную инференцию в реальном времени с задержкой 11.82 мс на IMX500, полностью соответствуя требованиям к памяти и операторам.
CoMMET: To What Extent Can LLMs Perform Theory of Mind Tasks?
Представлен новый мультимодальный набор данных CoMMET, который расширяет оценку способности LLM рассуждать о ментальных состояниях других людей, предлагая многооборотное тестирование и охватывая широкий спектр ментальных состояний. Это первый мультимодальный набор данных для оценки ToM в многооборотном разговорном контексте. Исследование включает оценку LLM разных семейств и размеров, анализируя их сильные и слабые стороны.
EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting
EnTransformer – это глубокий генеративный фреймворк, объединяющий engression и Transformers для прогнозирования многомерных вероятностных временных рядов. Модель вводит стохастический шум и оптимизирует энергетическую оценку, напрямую изучая условное предиктивное распределение. EnTransformer генерирует согласованные траектории прогноза и эффективно моделирует временные зависимости и перекрестные связи между рядами. Эксперименты на различных бенчмарках показывают, что EnTransformer обеспечивает откалиброванные вероятностные прогнозы, превосходящие существующие модели.
Inverse Neural Operator for ODE Parameter Optimization
Предложен Inverse Neural Operator (INO) – двухэтажный фреймворк для восстановления скрытых параметров ODE из разреженных, частичных наблюдений. Первый этап включает Conditional Fourier Neural Operator (C-FNO) с кросс-вниманием, который реконструирует траектории ODE. Второй этап использует Amortized Drifting Model (ADM) для поиска параметров. INO превосходит градиентные и амортизированные базовые модели по точности и скорости.
The Landscape of Generative AI in Information Systems: A Synthesis of Secondary Reviews and Research Agendas
Исследование, основанное на систематическом обзоре литературы, показывает, что внедрение генеративного ИИ сопряжено с техническими, этическими и управленческими проблемами. Обнаружено несоответствие между быстрой эволюцией технологий GenAI и медленной адаптацией социальных систем. Предлагается исследовательская программа для совместного развития технических возможностей, организационных процедур, социальных ценностей и нормативных институтов.
PicoSAM3 CoMMET EnTransformer Inverse Neural Operator The Landscape of Generative AI PicoSAM3 PDF CoMMET PDF EnTransformer PDF Inverse Neural Operator PDF The Landscape of Generative AI PDF
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru