Mistral ai представляет voxtral tts – модель синтеза речи

Автор

Heli

Опубликовано 29.03.2026

0,0

Компания Mistral AI выпустила Voxtral TTS, модель потоковой синтеза речи с открытым весом, предназначенную для генерации голоса на нескольких языках с низкой задержкой. Размер модели составляет 4 миллиарда параметров.

Voxtral TTS способна генерировать речь в потоковом режиме, что позволяет снизить задержку и повысить скорость отклика. Модель поддерживает 9 языков: английский, французский, немецкий, испанский, голландский, португальский, итальянский, хинди и арабский. Модель имеет открытый вес, что позволяет исследователям и разработчикам использовать и адаптировать ее для своих собственных нужд.

Разработчики утверждают, что Voxtral TTS обеспечивает высокое качество генерации голоса и подходит для различных приложений, таких как голосовые помощники, системы преобразования текста в речь и мультимедийные приложения. Модель имеет задержку 70 мс для 10-секундного голосового примера и 500 символов ввода и коэффициент RTF около 9.7x.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Похожие новости

Mistral ai представляет voxtral tts – модель синтеза речи

Похожие новости

Пятиуровневая структура безопасности для автономных агентов llm и ещё 17 новости

nvidia выпустила nemotron-cascade 2 – moe модель и ещё 9 новости

alibaba qwen 3.5 small: новые модели для устройств и ещё 6 новости

Создание ai-агента для веба с помощью molmo web-4b и ещё 8 новости

context hub: новый инструмент для кодирующих агентов от эндрю нга и ещё 12 но...

Безопасные конвейеры llm с outlines и pydantic и ещё 15 новости