
Подразделение FAIR компании Meta* (Марк Цукерберг) выпустило Omnilingual ASR, опенсорсную систему автоматического распознавания речи, которая поддерживает 1600 языков, включая 500 языков, ранее не представленых в ИИ-системах. Система реализует концепцию «Bring Your Own Language», позволяя добавлять новые языки с минимальным набором аудиозаписей и текстовых примеров без необходимости полного переобучения модели.

Модели семейства Omnilingual ASR имеют размеры от 300 млн до 7 млрд параметров. Для 78% поддерживаемых языков уровень ошибки по символам (CER) не превышает 10%, что демонстрирует высокую точность даже для редких языков. Кроме того, исследователи опубликовали Omnilingual ASR Corpus, датасет с аудио- и текстовыми данными для 350 языков, что даёт возможность другим разработчикам тренировать и тестировать собственные модели.
FAIR отмечает, что проект направлен на демократизацию технологий распознавания речи, расширяя их на малоизвестные и редкие языки, что может помочь в сохранении культурного и лингвистического разнообразия.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Meta* и ее продукты (Facebook, Instagram) запрещены на территории Российской Федерации
Автор: cognitronn
- Запись добавлена: 11.11.2025 в 06:22
- Оставлено в
Советуем прочесть:
- Google выпустил приложение NotebookLM для Android и iOS
- Hume AI выпустил быструю модель для синтеза речи
- Журнал Time выпустил список лучших изобретений 2025 года
- Meta* назначает бывшего директора Google DeepMind руководителем своей исследовательской лаборатории AI
- Google выпустил гайд по созданию работающих AI-агентов
- Google выпустил предварительную версию улучшенной модели ИИ Gemini 2.5 Flash
- Разработчик выпустил llm.js — библиотеку для запуска больших языковых моделей в браузере
- Google выпустил конкурента Cursor
- Neuphonic выпустил on-device TTS с моментальным клонированием голоса
- Windsurf выпустил быструю модель для программирования


