Цифровизация уже уничтожила множество языков, а 40% из оставшихся находятся на грани вымирания. В мире существует немногим больше 7100 живых языков, но только представьте: половина населения земли говорит всего на 20-23 из них. И этот процесс принято называть «цифровой смертью» языков, когда многие из них перестают использоваться в цифровом пространстве, что ускоряет их исчезновение из реального употребления.
Казалось бы, вот интернет, где можно узнать о любом языке и общаться на любом языке мира. В чём же загвоздка? Главная проблема заключается в слишком быстром развитии информационных технологий, в частности искусственного интеллекта, за которым носители редких диалектов и языков просто не успевают.
Конечно, в нейросети загружено довольно много языков, но всё же нельзя сказать, что они «знают» все существующие. Вы можете сказать: «так не все люди тоже знают кучу языков». Да, это правда, но невозможно сравнить искусственный интеллект и настоящего человека. Первым пользуется уже большая часть людей на планете и, конечно, эту большую часть составляют люди, которые говорят, как было написано выше, на 20-23 языках. Соответственно, разработка ведётся именно на них, да и то не на всех, чаще всего выбирают мировые: английский, конечно, китайский, русский, испанский и некоторые другие. И получается, что в районе 7000 языков просто игнорируется и теряется в информационном пространстве.
Также, довольно опасным остаётся факт потери контекста. Что это такое? Искусственный интеллект фиксирует правила и использование языка лишь формально. Я имею в виду, что нейросеть не имеет возможности, она просто на просто не умеет углубляться в культуру страны языка и учитывать контекстуальные, глубинные нюансы языковой структуры.
Но несмотря на эти минусы и проблемы, мне не хотелось бы демонизировать ИИ и технологии, ведь они могут всё же быть и полезными в сохранении языков.
-
Благодаря технологическому прогрессу можно удобно вести документацию в цифровом формате. Нейросети сильно упрощают транскрибирование аудиозаписей, то есть становится возможно автоматически расшифровывать и фиксировать аудиозаписи носителей. Это поможет сохранить слова и произношение редкого языка, а дальше, возможно, и восстановить его.
-
В дальнейшем может появиться больше инструментов обучения и возрождения языков. С появлением адаптивных систем изучения языка и генерацией учебных материалов для них станет намного легче расширять языковые области и поддерживать существование малых языковых групп.
-
Развитие технологий перевода и обработки языков, голосовых ассистентов для более узких групп и автоматических субтитров облегчат как изучение с развитием, так и сохранение языков.
Но каково же будущее малых языковых групп — ждёт их коэволюция или окончательная смерть?
Сейчас мы наблюдаем такой парадокс современности: нейросеть может как сохранить языковое разнообразие, так и уничтожить его, отдав предпочтение доминирующим языкам. Я считаю, что со вторым исходом необходимо бороться, чтобы было больше возможностей сохранить культуру малых групп, которая держится на своём языке. Чтобы это получилось, нужно стараться делать технологии более доступными для отдельных языковых сообществ, объединять для обучения нейросетей традиционные знания и цифровые методы, а также сотрудничать с носителями языков.
Хотелось бы рассказать о нескольких успешных высокотехнологичных проектах для разных языков:
• Glossika Viva — платформа для изучения языков с носителями. Только это не обычная онлайн-школа, здесь языки преподают настоящие носители с разными акцентами, живущие в разных странах и в принципе в разных уголках мира! А выучить можно более 60 языков, и, если выбрать вымирающий, например, хакка, уэльский или каталанский, это будет совершенно бесплатно.
• The Endangered Languages Project — это интерактивная карта вымирающих языков мира. После кропотливой работы лингвисты занесли туда очень много ресурсов, и теперь там можно найти буквально всё о забытых языков от России до Америки, а также прочитать их историю, почитать материалы и примеры использования.
• Wikitongues — сайт с собранными мировыми языками по алфавиту. Здесь также можно найти всевозможные языки с информацией о них самих и о говорящих на них людей.
В заключение хотелось бы сказать, что язык — очень чувствительная материя, которая нуждается в постоянной поддержке. На языке держится всё: культура, ценности и весь народ, и его нельзя оставлять без должного внимания, даже если осталось всего 400 человек, знающих его.
Автор: rootcode1


