AI news

Исследования в нейросетях: безопасное «забывание», роботы с предсказанием и у

Heli
Автор
Heli
Опубликовано 31.01.2026
0,0
Views 17

Исследовательское сообщество представило сразу три значимых работы, каждая из которых решает фундаментальную задачу в своей области машинного обучения.

Учёные предложили новый подход к удалению личной информации из больших языковых моделей (LLM). Существующие методы часто приводят к «переобучению» — потере не только ненужных, но и полезных знаний. Новая техника, названная PerTA (per-parameter task arithmetic), позволяет более точно регулировать процесс удаления информации. Она анализирует важность каждого параметра модели для сохранения или «забывания» данных и соответствующим образом корректирует изменения. Это достигается с помощью оценки градиентов или приближения к информации Фишера. Эксперименты показали, что PerTA эффективнее стандартных методов, позволяя удалять личную информацию без существенной потери общей производительности модели. Новая схема сочетает скорость и эффективность «арифметического» подхода к удалению данных с более точным контролем над процессом.

Параллельно исследователи разработали новый подход к обучению роботов, основанный на создании «видео-моделей мира». Эти модели позволяют роботу «предсказывать» ближайшее будущее, понимая связь между действиями и визуальными изменениями в окружающей среде. Новая система, названная LingBot-VA, объединяет предсказание кадров видео и выполнение задач в едином процессе. Она использует архитектуру Mixture-of-Transformers для обработки визуальной информации и действий, а также механизм обратной связи для улучшения обучения на основе реальных наблюдений. Особенность системы — асинхронный конвейер, который позволяет параллельно планировать действия и управлять моторами, повышая эффективность управления. LingBot-VA успешно протестирована как в симуляции, так и в реальном мире, демонстрируя хорошие результаты в манипулировании объектами, обучении на ограниченном количестве данных и адаптации к новым условиям. Код и модель доступны для использования сообществу.

В третьей работе учёные исследовали способ ускорить обучение нейронных сетей, используя метод, известный как Sequential Monte Carlo (SMC). SMC позволяет более точно оценивать параметры сети, но обычно требует больших вычислительных ресурсов. В работе предложен подход, который позволяет постепенно добавлять небольшие порции данных (мини-пакеты) при оценке вероятности и градиентов в SMC. Это позволяет снизить вычислительные затраты, сохранив при этом высокую точность. В результате экспериментов на задачах классификации изображений удалось добиться ускорения обучения в 6 раз с незначительной потерей точности. Это может быть полезно для обучения больших и сложных нейронных сетей.

Вместе эти исследования демонстрируют многовекторное развитие машинного обучения: от повышения конфиденциальности языковых моделей до практических применений в робототехнике и оптимизации вычислительных процессов.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Похожие новости