timer-s1: модель для временных рядов
Timer-S1: Модель для временных рядов
5 марта 2026 года представлена Timer-S1, мощная модель-основа для временных рядов, использующая архитектуру Mixture-of-Experts (MoE) с 8.3 миллиардами параметров, 0.75 миллиардами активированных параметров для каждого токена и контекстом длиной 11.5К. Для преодоления ограничений масштабируемости в существующих моделях, разработчики использовали Serial Scaling в трех измерениях: архитектура модели, набор данных и конвейер обучения. Timer-S1 интегрирует разреженные блоки TimeMoE и универсальные блоки TimeSTP для Serial-Token Prediction (STP), подхода к обучению, который соответствует последовательной природе прогнозирования. Этот подход использует последовательные вычисления для улучшения долгосрочных прогнозов, избегая при этом дорогостоящих и подверженных ошибкам методов прогнозирования.
Для создания высококачественного и непредвзятого набора данных для обучения, был создан TimeBench, содержащий триллион временных точек, и применено тщательное увеличение данных для снижения предвзятости. Также был разработан этап постобучения, включающий продолжение предварительного обучения и расширение контекста, для повышения производительности в краткосрочной и долгосрочной перспективе.
Оценка на платформе GIFT-Eval показала, что Timer-S1 достигает передовых результатов прогнозирования, получая лучшие оценки MASE и CRPS как предварительно обученная модель. Timer-S1 будет опубликована для дальнейших исследований. View on Hugging Face Read PDF
DSA-SRGS: Реконструкция DSA с суперразрешением
5 марта 2026 года представлена DSA-SRGS, первая платформа для суперразрешающей реконструкции динамических разреженных изображений DSA. DSA-SRGS решает проблему отсутствия возможности суперразрешения, которая препятствует восстановлению тонких деталей и сложных структур сосудов. Для этого в систему интегрирован модуль обучения текстур Multi-Fidelity, использующий высококачественные данные из модели суперразрешения, специально настроенной для DSA.
Для смягчения потенциальных артефактов, возникающих из-за псевдо-меток, модуль использует стратегию Confidence-Aware, которая адаптивно взвешивает сигналы контроля между исходными изображениями с низким разрешением и сгенерированными изображениями с высоким разрешением. Разработана также Radiative Sub-Pixel Densification — адаптивная стратегия, использующая накопление градиента при субпиксельной дискретизации с высоким разрешением для уточнения радиационных гауссовских ядер 4D.
Эксперименты на двух клинических наборах данных DSA показали, что DSA-SRGS превосходит современные методы как по количественным метрикам, так и по качеству визуализации. View on Hugging Face Read PDF
MOOSEnger: AI агент для экосистемы MOOSE
5 марта 2026 года представлен MOOSEnger, AI агент, разработанный для Multiphysics Object-Oriented Simulation Environment (MOOSE). MOOSEnger предлагает рабочий процесс, который преобразует естественный язык в выполняемые входные данные, объединяя генерацию с извлечением информации из документации и примеров с детерминированным, MOOSE-совместимым парсингом, проверкой и инструментами исполнения.
Входной конвейер предварительной проверки удаляет скрытые артефакты форматирования, исправляет некорректную структуру HIT с помощью ограниченного грамматически-ограниченного цикла и решает проблемы с недопустимыми типами объектов с помощью поиска по регистру синтаксиса приложения. Входы затем проверяются и, при необходимости, тестируются с помощью среды выполнения MOOSE через бэкэнд, основанный на MCP, с локальным резервным копированием, переводя диагнозы решателя в итеративные обновления для проверки и исправления.
Встроенные оценки показывают метрики RAG (верность, релевантность, точность контекста) и конечный успех за счет фактического выполнения. На наборе из 125 запросов, охватывающих диффузию, переходное теплопроводность, механику твердого тела, пористый поток и несжимаемые уравнения Навье–Стокса, MOOSEnger достигает 0.93 процента успешного выполнения, в то время как у LLM-only базовый уровень – 0.08 процента. View on Hugging Face Read PDF
CONE: Встраивания для числовых данных
5 марта 2026 года представлена CONE, гибридная трансформерная модель кодировщика, которая кодирует числа, диапазоны и гауссианы в векторное пространство встраивания, сохраняя единичные и переменные семантические значения. В модель интегрирован новый алгоритм для построения композитных встраиваний, который объединяет числовые значения, диапазоны или гауссианы с их соответствующими единицами и именами атрибутов для точного захвата их сложной семантики.
Экспериментальная оценка на больших масштабах данных в различных областях (веб, медицина, финансы и правительство) подтвердила сильные возможности CONE в области числового рассуждения, достигнув оценки F1 87.28% на DROP, с улучшением до 9.37% по сравнению с современными базовыми показателями и значительным увеличением Recall@10 до 25%. View on Hugging Face Read PDF
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru