AI news

dict внедряет "digital bayanihan" для обучения ИИ и цифровизации

Heli
Автор
Heli
Опубликовано 02.03.2026
0,0
Views 3

dict внедряет "Digital Bayanihan"

DICT (Департамент информационных и коммуникационных технологий) запускает программу "Digital Bayanihan", которая обучает студентов навыкам работы с искусственным интеллектом и помогает небольшим магазинам перейти в цифровой формат.

Переосмысление ранжирования текста в глубоких исследованиях

Исследование, проведённое 25 февраля 2026 года Чжуаном Мэном, Литу Оу, Шоном Макавани и Джеффом Далтоном, посвящено глубоким исследованиям, которые решают сложные запросы посредством интенсивного изучения веб-пространства. Большинство работ в этой области используют агентов на основе больших языковых моделей (LLM) с непрозрачными API веб-поиска, позволяющими им итеративно выдавать поисковые запросы, извлекать внешние доказательства и рассуждать на их основе.

Несмотря на важную роль поиска в глубоких исследованиях, "чёрные ящики" веб-поисковых API затрудняют систематический анализ компонентов поиска, что оставляет поведение установленных методов ранжирования текста в глубоких исследованиях в значительной степени неясным. Авторы воспроизвели ряд ключевых выводов и лучших практик для методов ранжирования текста в условиях глубоких исследований, изучив их эффективность с точки зрения (i) единиц извлечения (документы против отрывков), (ii) конфигураций конвейера (разные извлекатели, переранжировщики и глубины переранжирования) и (iii) характеристик запросов (несоответствие между запросами, выпущенными агентом, и обучающими запросами ранжировщиков текста).

Эксперименты проводились на наборе данных BrowseComp-Plus с фиксированным корпусом, оценивая 2 агента с открытым исходным кодом, 5 извлекателей и 3 переранжировщика в различных настройках. Было обнаружено, что запросы, выпущенные агентом, обычно следуют синтаксису веб-поиска (например, точные совпадения в кавычках), благоприятствуя лексическим, изученным разреженным и многовекторным извлекателям; единицы на уровне отрывков более эффективны при ограниченных контекстных окнах и избегают трудностей нормализации длины документов при лексическом извлечении; переранжирование является весьма эффективным; перевод запросов, выпущенных агентом, в вопросы на естественном языке значительно устраняет несоответствие запросов. Ресурсы на Hugging Face PDF

Когда обучение вредит: фиксированная RNN-сеть с полюсами для обучения в реальном времени

Рекуррентные нейронные сети (RNN) могут рассматриваться как дискретно-временные модели пространства состояний, где эволюция состояния соответствует операции фильтрации с бесконечным импульсом (IIR), определяемой как весами прямого распространения, так и рекуррентными полюсами. Хотя, в принципе, все параметры, включая местоположение полюсов, могут быть оптимизированы с помощью обратного распространения во времени (BPTT), такое совместное обучение влечет за собой значительные вычислительные затраты и часто непрактично для приложений с ограниченными обучающими данными. Сети с эхо-состоянием (ESN) смягчают это ограничение, фиксируя рекуррентную динамику и обучая только линейный выход, обеспечивая эффективную и стабильную онлайн-адаптацию.

В данной работе анализируется, почему обучение рекуррентным полюсам не дает ощутимых преимуществ в сценариях обучения в реальном времени с ограниченными данными, как аналитически, так и эмпирически. Анализ показал, что обучение полюсам делает проблему оптимизации весов сильно невыпуклой, требуя значительно большего количества обучающих выборок и итераций для сходимости методов на основе градиента к значимым решениям. Эмпирически было обнаружено, что для данных со сложными значениями градиентный спуск часто демонстрирует продолжительные плато, а расширенные оптимизаторы дают ограниченное улучшение. В отличие от этого, архитектуры с фиксированными полюсами индуцируют стабильные и хорошо обусловленные представления состояний даже при ограниченных обучающих данных.

Численные результаты показывают, что сети с фиксированными полюсами достигают лучшей производительности с меньшей сложностью обучения, что делает их более подходящими для задач онлайн-обучения в реальном времени.

Нарушение злонамеренного использования ИИ

Новый отчет об угрозах рассматривает, как злоумышленники объединяют модели ИИ с веб-сайтами и социальными платформами и что это означает для обнаружения и защиты.

Облако против локального использования против гибридного для ИИ-моделей: руководство для практиков

Для большинства лидеров малого и среднего бизнеса вопрос об ИИ изменился. Если раньше спрашивали "Нужно ли нам использовать ИИ?", то сейчас спрашивают "Где нам его запускать?".

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие новости