- BrainTools - https://www.braintools.ru -
Meta запускает новую программу в партнёрстве с ЮНЕСКО по сбору речевых записей и расшифровок, которые, по словам компании, помогут в разработке общедоступного AI в будущем.

Партнерская программа [1]языковых технологий ищет участников, которые могут предоставить более 10 часов речевых записей с транскрипцией, большие объемы письменного текста и наборы переведенных предложений на «разных языках». По словам Meta, партнеры будут работать с командами компании по искусственному интеллекту [2], чтобы интегрировать эти языки в модели распознавания речи и перевода на основе AI, которые после завершения разработки будут открыты для всеобщего доступа.
Среди партнёров на данный момент — правительство Нунавута, малонаселённой территории на севере Канады. Некоторые жители Нунавута говорят на языках инуитов, известных под общим названием инукту.
«Наши усилия особенно сосредоточены на малоизученных языках в поддержку работы ЮНЕСКО, — написала Meta в блоге, предоставленном TechCrunch. — В конечном счёте, наша цель — создать интеллектуальные системы, которые смогут понимать и удовлетворять сложные потребности [3] людей независимо от языка или культурного происхождения».
В дополнение к новой программе Meta сообщила, что выпускает бенчмарк машинного перевода с открытым исходным кодом [4] для оценки производительности моделей языкового перевода. Бенчмарк, состоящий из предложений, составленных лингвистами, поддерживает семь языков, и к нему можно получить доступ — и внести свой вклад — с платформы для разработки AI Hugging Face.
Meta рассматривает обе инициативы как благотворительные. Но компания выиграет от усовершенствованных моделей распознавания речи и перевода.
Meta продолжает расширять количество языков [5], которые поддерживает её помощник на базе искусственного интеллекта Meta AI, а также тестировать такие функции, как автоматический перевод для авторов. В сентябре прошлого года Meta объявила, что начнёт тестировать инструмент для перевода голосов в Instagram Reels, позволяющий авторам дублировать свою речь и автоматически синхронизировать её с губами [6].
То, как Meta относится к контенту на других языках, кроме английского, на своих платформах, стало предметом многочисленных критических замечаний. Согласно одному из отчётов, Facebook оставил без пометок почти 70% италоязычной и испаноязычной дезинформации о COVID [7] по сравнению с 29% аналогичной дезинформации на английском языке. А утечка документов компании [8] показала, что посты на арабском языке регулярно ошибочно помечаются как разжигание ненависти.
Meta заявила, что предпринимает шаги по улучшению своих технологий перевода и модерации.
*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации
Источник [9]
Автор: mefdayy
Источник [10]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/11982
URLs in this post:
[1] программа : https://docs.google.com/forms/d/e/1FAIpQLSdzcRdtkQCuTrXw727DgJgWbOPKDj5v0bArgGfQUTT6sEopFw/viewform
[2] интеллекту: http://www.braintools.ru/article/7605
[3] потребности: http://www.braintools.ru/article/9534
[4] бенчмарк машинного перевода с открытым исходным кодом: https://huggingface.co/spaces/facebook/bouquet
[5] расширять количество языков: https://techcrunch.com/2024/10/09/meta-ai-launches-in-six-countries-including-brazil-and-uk/
[6] позволяющий авторам дублировать свою речь и автоматически синхронизировать её с губами: https://techcrunch.com/2024/09/25/meta-ai-gets-lip-synced-translations-and-celebrity-voices-like-judi-dench-and-john-cena/
[7] италоязычной и испаноязычной дезинформации о COVID: https://secure.avaaz.org/campaign/en/facebook_coronavirus_misinformation/
[8] утечка документов компании: https://restofworld.org/2021/facebook-is-bad-at-moderating-in-english-in-arabic-its-a-disaster/
[9] Источник: https://techcrunch.com/2025/02/07/meta-launches-new-program-to-improve-speech-and-translation-ai/
[10] Источник: https://habr.com/ru/companies/bothub/news/880474/?utm_source=habrahabr&utm_medium=rss&utm_campaign=880474
Нажмите здесь для печати.