- BrainTools - https://www.braintools.ru -

«Яндекс» и Институт востоковедения РАН разработали ИИ‑помощника для работы с научной информацией на восточных языках

Компания «Яндекс» и Институт востоковедения РАН создали [1] ИИ‑помощника, который в сотни раз ускоряет анализ данных на восточных языках. Помощник обрабатывает до 1 тысячи источников в день вместо 8–10 и помогает исследователям быстрее работать с первоисточниками стран Азии, Африки и Ближнего Востока. Инструмент проходит тестирование и доступен для сотрудников Института востоковедения РАН. После тестирования помощник будет размещён для всех исследователей в открытом доступе.

«Яндекс» и Институт востоковедения РАН разработали ИИ‑помощника для работы с научной информацией на восточных языках - 1

На ноябрь 2025 года доступ к оригинальным источникам по восточным странам ограничен, а многие материалы выходят только на национальных языках и редко переводятся. Такие ограничения затрудняют академические и аналитические исследования, а зачастую формируют искажённое восприятие [2] событий через переводы‑интерпретации.

Помощник разработан на базе платформы для разработки ИИ‑приложений и агентов Yandex AI Studio. Инструмент обрабатывает научные тексты, выделяет ключевые факты и формирует краткие аналитические выжимки. Обучением [3] генеративных моделей занимались специалисты платформы Yandex Cloud и студенты Школы анализа данных.

Кроме того, ИИ‑помощник анализирует публикации в китайских СМИ и создаёт русскоязычные дайджесты, что позволяет исследователям оперативно получать информацию о событиях в регионе.

Как отметил старший научный [4] сотрудник лаборатории цифровых исследований современного Востока Института востоковедения РАН Александр Костыркин, до создания помощника анализ материалов на оригинальных языках занимал много времени и ограничивал количество обрабатываемых источников. По словам Костыркина, с помощью ИИ процесс анализа ускоряется, например, время поиска и анализа сокращается в 6–8 раз — с нескольких часов до 10–15 минут на одну исследовательскую задачу.

Для информационного наполнения помощника использовался архив востоковедных знаний, составленный на основе публикаций Института востоковедения РАН, включая монографии, научные статьи сотрудников и так далее. База ИИ‑помощника уже превысила 1,5 млн документов, представленных в четырёх вариантах китайского языка: континентальном, тайваньском, гонконгском и сингапурском.

По словам директора по национальным и стратегическим проектам Yandex Cloud Анны Лемякиной, востоковедам важно работать с первоисточниками, чтобы понимать язык, контекст и логику [5] региона, о котором исследователи пишут. Как объяснила Лемякина, цель компании — чтобы технологии помогали учёным видеть больше и работать с данными, которые раньше были труднодоступны.

Директор Института востоковедения РАН, доктор исторических наук Аликбер Аликберов рассказал, что Институт востоковедения РАН проходит масштабную цифровую трансформацию, где основой выступает системная интеграция ИИ‑технологий для работы с первоисточниками.

В будущем планируется расширить языковую поддержку ИИ‑помощника и добавить японский, арабский, турецкий, персидский и другие восточные языки, чтобы предоставить российским исследователям прямой доступ к уникальным корпусам знаний и источникам.

Автор: Lexx_Nimofff

Источник [6]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/21937

URLs in this post:

[1] создали: https://yandex.ru/company/news/12-11-2025-02

[2] восприятие: http://www.braintools.ru/article/7534

[3] Обучением: http://www.braintools.ru/article/5125

[4] научный: http://www.braintools.ru/article/7634

[5] логику: http://www.braintools.ru/article/7640

[6] Источник: https://habr.com/ru/news/966510/?utm_source=habrahabr&utm_medium=rss&utm_campaign=966510

www.BrainTools.ru

Rambler's Top100