- BrainTools - https://www.braintools.ru -

Meta* запускает программу по сбору языковых данных для развития AI

Meta запускает новую программу в партнёрстве с ЮНЕСКО по сбору речевых записей и расшифровок, которые, по словам компании, помогут в разработке общедоступного AI в будущем.

Meta* запускает программу по сбору языковых данных для развития AI - 1

Партнерская программа  [1]языковых технологий ищет участников, которые могут предоставить более 10 часов речевых записей с транскрипцией, большие объемы письменного текста и наборы переведенных предложений на «разных языках». По словам Meta, партнеры будут работать с командами компании по искусственному интеллекту [2], чтобы интегрировать эти языки в модели распознавания речи и перевода на основе AI, которые после завершения разработки будут открыты для всеобщего доступа.

Среди партнёров на данный момент — правительство Нунавута, малонаселённой территории на севере Канады. Некоторые жители Нунавута говорят на языках инуитов, известных под общим названием инукту.

«Наши усилия особенно сосредоточены на малоизученных языках в поддержку работы ЮНЕСКО, — написала Meta в блоге, предоставленном TechCrunch. — В конечном счёте, наша цель — создать интеллектуальные системы, которые смогут понимать и удовлетворять сложные потребности [3] людей независимо от языка или культурного происхождения».

В дополнение к новой программе Meta сообщила, что выпускает бенчмарк машинного перевода с открытым исходным кодом [4] для оценки производительности моделей языкового перевода. Бенчмарк, состоящий из предложений, составленных лингвистами, поддерживает семь языков, и к нему можно получить доступ — и внести свой вклад — с платформы для разработки AI Hugging Face.

Meta рассматривает обе инициативы как благотворительные. Но компания выиграет от усовершенствованных моделей распознавания речи и перевода.

Meta продолжает расширять количество языков [5], которые поддерживает её помощник на базе искусственного интеллекта Meta AI, а также тестировать такие функции, как автоматический перевод для авторов. В сентябре прошлого года Meta объявила, что начнёт тестировать инструмент для перевода голосов в Instagram Reels, позволяющий авторам дублировать свою речь и автоматически синхронизировать её с губами [6].

То, как Meta относится к контенту на других языках, кроме английского, на своих платформах, стало предметом многочисленных критических замечаний. Согласно одному из отчётов, Facebook оставил без пометок почти 70% италоязычной и испаноязычной дезинформации о COVID [7] по сравнению с 29% аналогичной дезинформации на английском языке. А утечка документов компании [8] показала, что посты на арабском языке регулярно ошибочно помечаются как разжигание ненависти.

Meta заявила, что предпринимает шаги по улучшению своих технологий перевода и модерации.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник [9]

Автор: mefdayy

Источник [10]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/11982

URLs in this post:

[1] программа : https://docs.google.com/forms/d/e/1FAIpQLSdzcRdtkQCuTrXw727DgJgWbOPKDj5v0bArgGfQUTT6sEopFw/viewform

[2] интеллекту: http://www.braintools.ru/article/7605

[3] потребности: http://www.braintools.ru/article/9534

[4] бенчмарк машинного перевода с открытым исходным кодом: https://huggingface.co/spaces/facebook/bouquet

[5] расширять количество языков: https://techcrunch.com/2024/10/09/meta-ai-launches-in-six-countries-including-brazil-and-uk/

[6] позволяющий авторам дублировать свою речь и автоматически синхронизировать её с губами: https://techcrunch.com/2024/09/25/meta-ai-gets-lip-synced-translations-and-celebrity-voices-like-judi-dench-and-john-cena/

[7] италоязычной и испаноязычной дезинформации о COVID: https://secure.avaaz.org/campaign/en/facebook_coronavirus_misinformation/

[8] утечка документов компании: https://restofworld.org/2021/facebook-is-bad-at-moderating-in-english-in-arabic-its-a-disaster/

[9] Источник: https://techcrunch.com/2025/02/07/meta-launches-new-program-to-improve-speech-and-translation-ai/

[10] Источник: https://habr.com/ru/companies/bothub/news/880474/?utm_source=habrahabr&utm_medium=rss&utm_campaign=880474

www.BrainTools.ru

Rambler's Top100