LLM

firered-ocr-2b решает проблему галлюцинаций в таблицах и latex

Heli
Автор
Heli
Опубликовано 02.03.2026
0,0
Views 1

Команда FireRedTeam выпустила FireRed-OCR-2B, использующую GRPO (Graph-enhanced Relation-aware Pre-training Optimization) для решения проблемы структурных галлюцинаций в таблицах и LaTeX, предназначенную для разработчиков программного обеспечения.

FireRed-OCR-2B – это модель оптического распознавания символов (OCR). GRPO помогает модели точнее понимать взаимосвязи в структурированных документах, таких как таблицы и LaTeX-код. Проблема структурных галлюцинаций возникает, когда OCR-модели ошибочно "видят" структуру в тексте, где её нет, или неверно интерпретируют существующую структуру.

Команда FireRedTeam утверждает, что их подход решает эту проблему, предоставляя более надежное распознавание для разработчиков, работающих с таблицами и LaTeX. Модель может быть использована для преобразования изображений таблиц и LaTeX-кода в редактируемый текст. Это полезно для автоматизации задач, таких как извлечение данных из исследовательских работ или преобразование старых документов в цифровой формат.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие статьи