waxal: открытый ресурс для африканских языков
WAXAL — это масштабный открытый ресурс, предназначенный для развития технологий распознавания и синтеза речи для африканских языков. Он состоит из более чем 1700 часов размеченной речи на 50 языках Африки к югу от Сахары, а также большого набора инструментов для обработки аудио и машинного обучения.
Ресурс включает в себя данные, охватывающие широкий спектр акцентов, говорящих и акустических условий. Данные собраны из различных источников, включая общедоступные наборы данных, записи, сделанные на местах, и краудсорсинговые усилия.
Для облегчения использования данных WAXAL предоставляет набор инструментов для обработки аудио, таких как извлечение признаков и фильтрация шума, а также инструменты машинного обучения, такие как обучение моделей и оценка. WAXAL предлагает как прямой доступ к данным, так и интеграцию с платформами Hugging Face [huggingface.co].
Создание WAXAL было вызвано нехваткой ресурсов для разработки технологий распознавания речи для африканских языков. Цель проекта — демократизировать доступ к этим технологиям, позволяя исследователям и разработчикам создавать приложения и сервисы на африканских языках. Доступ к ресурсу WAXAL можно получить по [arxiv.org/abs/2405.03427].
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru