Flowcorrect: Коррекция управления роботами в реальном времени

Генеративные политики управления роботами могут давать сбой при изменении распределения данных в реальном времени, однако многие из этих сбоев – это лишь незначительные отклонения: робот достигает почти правильной позиции и смог бы завершить действие с помощью небольшого корректирующего движения. Мы представляем FlowCorrect – систему для коррекции в реальном времени, которая превращает такие “почти-успешные” попытки в полноценные успехи, используя минимальное вмешательство со стороны человека, без необходимости полной переподготовки политики.

Принцип работы FlowCorrect

В процессе выполнения задачи оператор, используя упрощенный интерфейс виртуальной реальности, предоставляет краткие корректировки позиции робота. FlowCorrect использует эти редкие подсказки для локальной адаптации политики управления, улучшая действия без переобучения основной модели и сохраняя ее эффективность в уже освоенных сценариях.

Оценка эффективности

Испытания проводились на реальном роботе в трех задачах, связанных с манипулированием предметами на столе: перемещение объектов, переливание жидкости и установка стакана в вертикальное положение. FlowCorrect, используя минимальное количество корректировок, повысил успешность выполнения сложных задач на 85%, не оказывая негативного влияния на ранее решенные сценарии.

Ключевые преимущества

Результаты демонстрируют, что FlowCorrect обучается, используя очень малое количество демонстраций, и обеспечивает быструю и эффективную коррекцию генеративных политик управления роботами в реальном времени с участием человека. Система позволяет вносить инкрементные изменения, адаптируя политику в процессе ее эксплуатации.

Принцип работы FlowCorrect

Оценка эффективности

Ключевые преимущества

Похожие новости

Разработка программного обеспечения для подводных роботов и ещё 4 новости

Прогнозирование пространства-времени динамических сцен с помощью mgg

Neu-PiG: Быстрое восстановление 3D-объектов из облаков точек

Data Lake, Data Warehouse, Lakehouse, Data Mesh: Выбор архитектуры

корректировка оценок ии с помощью теории ответа на вопросы

Deep Learning For Forest Boundary Mapping: Dap vs Als Data