dict внедряет "digital bayanihan" для обучения ИИ и цифровизации
dict внедряет "Digital Bayanihan"
DICT (Департамент информационных и коммуникационных технологий) запускает программу "Digital Bayanihan", которая обучает студентов навыкам работы с искусственным интеллектом и помогает небольшим магазинам перейти в цифровой формат.
Переосмысление ранжирования текста в глубоких исследованиях
Исследование, проведённое 25 февраля 2026 года Чжуаном Мэном, Литу Оу, Шоном Макавани и Джеффом Далтоном, посвящено глубоким исследованиям, которые решают сложные запросы посредством интенсивного изучения веб-пространства. Большинство работ в этой области используют агентов на основе больших языковых моделей (LLM) с непрозрачными API веб-поиска, позволяющими им итеративно выдавать поисковые запросы, извлекать внешние доказательства и рассуждать на их основе.
Несмотря на важную роль поиска в глубоких исследованиях, "чёрные ящики" веб-поисковых API затрудняют систематический анализ компонентов поиска, что оставляет поведение установленных методов ранжирования текста в глубоких исследованиях в значительной степени неясным. Авторы воспроизвели ряд ключевых выводов и лучших практик для методов ранжирования текста в условиях глубоких исследований, изучив их эффективность с точки зрения (i) единиц извлечения (документы против отрывков), (ii) конфигураций конвейера (разные извлекатели, переранжировщики и глубины переранжирования) и (iii) характеристик запросов (несоответствие между запросами, выпущенными агентом, и обучающими запросами ранжировщиков текста).
Эксперименты проводились на наборе данных BrowseComp-Plus с фиксированным корпусом, оценивая 2 агента с открытым исходным кодом, 5 извлекателей и 3 переранжировщика в различных настройках. Было обнаружено, что запросы, выпущенные агентом, обычно следуют синтаксису веб-поиска (например, точные совпадения в кавычках), благоприятствуя лексическим, изученным разреженным и многовекторным извлекателям; единицы на уровне отрывков более эффективны при ограниченных контекстных окнах и избегают трудностей нормализации длины документов при лексическом извлечении; переранжирование является весьма эффективным; перевод запросов, выпущенных агентом, в вопросы на естественном языке значительно устраняет несоответствие запросов. Ресурсы на Hugging Face PDF
Когда обучение вредит: фиксированная RNN-сеть с полюсами для обучения в реальном времени
Рекуррентные нейронные сети (RNN) могут рассматриваться как дискретно-временные модели пространства состояний, где эволюция состояния соответствует операции фильтрации с бесконечным импульсом (IIR), определяемой как весами прямого распространения, так и рекуррентными полюсами. Хотя, в принципе, все параметры, включая местоположение полюсов, могут быть оптимизированы с помощью обратного распространения во времени (BPTT), такое совместное обучение влечет за собой значительные вычислительные затраты и часто непрактично для приложений с ограниченными обучающими данными. Сети с эхо-состоянием (ESN) смягчают это ограничение, фиксируя рекуррентную динамику и обучая только линейный выход, обеспечивая эффективную и стабильную онлайн-адаптацию.
В данной работе анализируется, почему обучение рекуррентным полюсам не дает ощутимых преимуществ в сценариях обучения в реальном времени с ограниченными данными, как аналитически, так и эмпирически. Анализ показал, что обучение полюсам делает проблему оптимизации весов сильно невыпуклой, требуя значительно большего количества обучающих выборок и итераций для сходимости методов на основе градиента к значимым решениям. Эмпирически было обнаружено, что для данных со сложными значениями градиентный спуск часто демонстрирует продолжительные плато, а расширенные оптимизаторы дают ограниченное улучшение. В отличие от этого, архитектуры с фиксированными полюсами индуцируют стабильные и хорошо обусловленные представления состояний даже при ограниченных обучающих данных.
Численные результаты показывают, что сети с фиксированными полюсами достигают лучшей производительности с меньшей сложностью обучения, что делает их более подходящими для задач онлайн-обучения в реальном времени.
Нарушение злонамеренного использования ИИ
Новый отчет об угрозах рассматривает, как злоумышленники объединяют модели ИИ с веб-сайтами и социальными платформами и что это означает для обнаружения и защиты.
Облако против локального использования против гибридного для ИИ-моделей: руководство для практиков
Для большинства лидеров малого и среднего бизнеса вопрос об ИИ изменился. Если раньше спрашивали "Нужно ли нам использовать ИИ?", то сейчас спрашивают "Где нам его запускать?".
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru