
Рынок интеллектуальной обработки документов (Intelligent Document Processing, IDP) очень обширный: в нём насчитывается более 100 поставщиков, включая компании из смежных рынков. Они предлагают как комплексные решения, так и отдельные компоненты. Руководителям предприятий, отвечающим за выбор приложений, рекомендуется использовать данный обзор, чтобы лучше понимать продукты ведущих игроков рынка.
Определение рынка / Описание
Gartner определяет решения интеллектуальной обработки документов (IDP) как специализированные инструменты интеграции данных, которые позволяют автоматически извлекать информацию из документов различных форматов и макетов. IDP-решения принимают документы, извлекают из них данные и передают их в зависимые приложения и бизнес-процессы. Такие решения могут поставляться в виде программного продукта и/или облачного сервиса.
Организации ежедневно получают и обрабатывают документы множества типов (заявки на кредит, страховые случаи, регистрация новых поставщиков и т.д.). Большинство этих документов изначально создаётся для восприятия человеком, а не машиной. Извлечение данных из таких документов — критически важный этап для последующей автоматизации. Именно эту задачу решают IDP-решения, частично или полностью заменяя ручной труд.
Документы поступают как в физическом (бумажном) виде, который нужно сканировать, так и в цифровом (email, PDF и др.). Макеты варьируются от структурированных (таблицы, счета, контракты) до полностью неструктурированных (свободный текст писем) и полуструктурированных (смесь первых двух типов).
Раньше извлечение данных требовало предварительной обработки человеком. Сегодня искусственный интеллект способен надежно выполнять эту работу. Современные IDP-решения основаны на проверенной десятилетиями технологии оптического распознавания символов (OCR), но вместо жёстких шаблонов используют контекстный анализ и машинное обучение, чтобы самостоятельно сопоставлять символы из документов разных форматов и макетов с нужными полями данных. Это позволяет обрабатывать широкий спектр типов документов и их вариаций.
Решения IDP должны уметь работать с документами разных форматов (цифровые/бумажные, текст/изображение), объёмов (одна или сотни страниц), качества (перекошенные, с помарками и т.д.), а также передавать извлечённые данные в другие системы. Для этого требуется полноценный конвейер преобразований.
Основные сценарии применения IDP
-
Автоматизированная обработка транзакционных документов
Данные извлекаются и сразу передаются в другие системы. Делится на два подтипа:-
Высокий объем, низкая сложность и вариативность
-
Низкий объем, высокая сложность и вариативность
-
-
Усиленное чтение/обработка (Augmented reading)
Понимание сложных документов для поддержки принятия решений: суммаризация, ответы на вопросы, направленное извлечение данных. -
Извлечение и хранение данных
Автоматическое извлечение и сохранение данных для последующего анализа и других задач.
Многие поставщики IDP специализируются на конкретных типах документов (например, коносаменты в логистике или страховые полисы). Рынок пока не коммодитизирован — не существует универсального решения, которое одинаково хорошо справляется со всеми типами документов. Поэтому при выборе поставщика критически важно проверять совместимость с вашими конкретными документами и схемами данных.
Обязательные функции (Mandatory Features)
-
Приум документов в множестве цифровых форматов и макетов
-
Предобработка, включая классификацию документов
-
Извлечение и синтез информации
-
Извлечение данных из изображений, текста, поддержка нескольких языков
-
Проверка и коррекция извлечённых данных (автоматическая и с участием человека)
-
Интеграция извлеченных данных в сторонние приложения и форматы файлов
-
Администрирование: настройка, развёртывание, кастомизация
-
Оркестрация и автоматизация (low-code/no-code, движок бизнес-правил и т.д.)
Распространенные дополнительные функции (Common Features)
-
Аналитика и отчётность на основе внутреннего хранилища извлеченных данных
-
Совместная работа участников процесса
-
Компонуемость (интеграция собственных, сторонних и клиентских сервисов)
-
ModelOps для управления моделями IDP
-
Многоязычный интерфейс и документация
-
Полноценное управление и governance всего workflow
-
Специализированные инструменты для обеспечения конфиденциальности, соответствия корпоративным политикам и безопасности
Вендоры
Дальше идет подробное описание вендоров, полный текст обзора можно найти здесь
https://www.tungstenautomation.com/learn/reports/tungsten-automation-recognized-as-idp-leader-by-gartner/thank-you
Подписывайтесь на Telegram канал BPM Developers.Рассказываем про бизнес-процессы:новости, гайды, полезная информация и юмор.
Автор: stas_makarov


