firered-ocr-2b решает проблему галлюцинаций в таблицах и latex
Команда FireRedTeam выпустила FireRed-OCR-2B, использующую GRPO (Graph-enhanced Relation-aware Pre-training Optimization) для решения проблемы структурных галлюцинаций в таблицах и LaTeX, предназначенную для разработчиков программного обеспечения.
FireRed-OCR-2B – это модель оптического распознавания символов (OCR). GRPO помогает модели точнее понимать взаимосвязи в структурированных документах, таких как таблицы и LaTeX-код. Проблема структурных галлюцинаций возникает, когда OCR-модели ошибочно "видят" структуру в тексте, где её нет, или неверно интерпретируют существующую структуру.
Команда FireRedTeam утверждает, что их подход решает эту проблему, предоставляя более надежное распознавание для разработчиков, работающих с таблицами и LaTeX. Модель может быть использована для преобразования изображений таблиц и LaTeX-кода в редактируемый текст. Это полезно для автоматизации задач, таких как извлечение данных из исследовательских работ или преобразование старых документов в цифровой формат.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru