
Подразделение FAIR компании Meta* (Марк Цукерберг) выпустило Omnilingual ASR, опенсорсную систему автоматического распознавания речи, которая поддерживает 1600 языков, включая 500 языков, ранее не представленых в ИИ-системах. Система реализует концепцию «Bring Your Own Language», позволяя добавлять новые языки с минимальным набором аудиозаписей и текстовых примеров без необходимости полного переобучения модели.

Модели семейства Omnilingual ASR имеют размеры от 300 млн до 7 млрд параметров. Для 78% поддерживаемых языков уровень ошибки по символам (CER) не превышает 10%, что демонстрирует высокую точность даже для редких языков. Кроме того, исследователи опубликовали Omnilingual ASR Corpus, датасет с аудио- и текстовыми данными для 350 языков, что даёт возможность другим разработчикам тренировать и тестировать собственные модели.
FAIR отмечает, что проект направлен на демократизацию технологий распознавания речи, расширяя их на малоизвестные и редкие языки, что может помочь в сохранении культурного и лингвистического разнообразия.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Meta* и ее продукты (Facebook, Instagram) запрещены на территории Российской Федерации
Автор: cognitronn
- Запись добавлена: 11.11.2025 в 06:22
- Оставлено в


