Учёные НИТУ МИСИС разработали новый способ ускоренной оптимизации систем оптического распознавания текста. Благодаря сочетанию методов машинного обучения и современных генеративных моделей искусственного интеллекта исследователям удалось значительно повысить точность распознавания текста на русском языке и сократить время подготовки таких систем с нескольких недель до 72 часов.
Исследователи НИТУ МИСИС представили новый подход к обучению систем распознавания, основанный на объединении инструментов машинного обучения и современных генеративных моделей искусственного интеллекта. Специалисты вуза создали замкнутый цикл взаимодействия систем распознавания и языковых моделей, благодаря которому система сама анализирует результаты распознавания и корректирует ошибки. Такой подход значительно ускоряет обучение. Процесс, который в классических схемах занимает до двух месяцев, в ходе эксперимента был сокращён до 72 часов непрерывной работы.
Магистрант Института компьютерных наук НИТУ МИСИС Кирилл Пронин объяснил, что качество распознавания превысило 90% для русского языка. Затраты на обучение моделей удалось снизить почти на треть, а использование генеративных нейросетей сократило необходимый объём тестовой выборки.
Разработчики изучили поведение систем на идеальных документах и реальных сканах с неровными подписями и печатями. Полученные данные позволили определить наиболее эффективные сочетания технологий.
Доцент кафедры бизнес-информатики и систем управления производством НИТУ МИСИС Александр Сулейкин рассказал, что исследователи предложили подход, где языковая модель помогает создавать сложные обучающие данные. Модели имитируют плохое качество печати, нестандартные шрифты или сложную вёрстку. Это позволяет научить систему распознавать текст в реальных неидеальных условиях, существенно повышая её точность и надёжность.
Дальнейшее развитие методов обучения на базе нейронных сетей ускорит появление точных и доступных решений для бизнеса и научных задач. Исследование было представлено на 20-й международной конференции в области применения искусственного интеллекта и машинного обучения ISKE 2025 в городе Шунде в Китае.
Автор: Lexx_Nimofff


