- BrainTools - https://www.braintools.ru -

Document AI от Mistral извлекает текст из документов и заметок с высокой точностью

Mistral AI представляет Document AI — модульную платформу для автоматизированной обработки документов, которая сочетает в себе распознавание символов, вывод структурированных данных и обработку естественного языка с гибкими вариантами развертывания.

Document AI от Mistral извлекает текст из документов и заметок с высокой точностью - 1

Document AI может с высокой точностью извлекать текст из PDF-файлов, файлов PowerPoint и Word, рукописных заметок, таблиц, диаграмм и сложных макетов.

Помимо простого распознавания текста, Document AI включает в себя расширенную функцию аннотирования, которая позволяет пользователям извлекать нужную информацию из документов и преобразовывать её в пользовательские форматы JSON.

Mistral предлагает два типа аннотаций [1]: «Аннотация BBox», которая помечает и описывает отдельные визуальные элементы, такие как диаграммы, таблицы или подписи, и «Аннотация документа», которая фиксирует структуру всего документа. Последняя в настоящее время ограничена исходными файлами размером до восьми страниц.

Оба варианта позволяют автоматически извлекать определённое содержимое, например, положения из договоров, суммы в счетах, данные о транзакциях из чеков или заголовки глав и URL-адреса из научных PDF-файлов.

Рабочий процесс показывает, как работает аннотирование документов с использованием оптического распознавания символов и языковой модели с поддержкой машинного зрения для создания различных форматов аннотаций.

Рабочий процесс показывает, как работает аннотирование документов с использованием оптического распознавания символов и языковой модели с поддержкой машинного зрения [2] для создания различных форматов аннотаций.

Аннотации основаны на пользовательских моделях данных и могут быть объединены с языковой моделью, способной распознавать изображения, для интерпретации даже сложных макетов и контента.

По словам Mistral AI, эта платформа хорошо подходит для организаций, работающих с большими объёмами разнородных документов и нуждающихся в высоком уровне автоматизации. Функции аннотирования требуют больше вычислительных мощностей, чем базовое распознавание текста, и оплачиваются отдельно.

Одной из ключевых особенностей Document AI является поддержка более 40 языков, включая многие нелатинские алфавиты. Система может распознавать текст в рукописных документах или сложных схемах, и компания Mistral заявляет о точности распознавания выше 99%.

Платформа предназначена для ряда секторов, включая правительственные учреждения, энергетические компании, исследовательские организации и юридические департаменты. Она также способствует обучению [3] моделей, которые распознают текст в определённой области. Для этого можно настроить модель под конкретную задачу. Например, пользователи могут анализировать медицинские записи или договоры, используя свои правила извлечения информации.

Document AI может работать локально или в частных облачных средах, что делает его подходящим для организаций со строгими требованиями к защите данных, суверенитету или нормативным требованиям — особенно в Европе или в отраслях, чувствительных к вопросам безопасности.

Компании могут использовать платформу для создания комплексных конвейеров обработки документов, от распознавания и извлечения текста до автоматизированного анализа. API доступно через платформу разработчиков Mistral la Plateforme [4], а бесплатная пробная версия доступна через интерфейс чата le Chat [5].

Обработка 1000 страниц через API стоит один доллар США. Извлечение информации в заранее заданном формате («аннотации») стоит три доллара США за 1000 страниц.

Компания Mistral впервые представила свой API для оптического распознавания текста в марте 2025 года [6] в качестве основы для Document AI. Этот API ознаменовал первый шаг компании в области модульной обработки документов, сочетающей быстрое распознавание текста со структурированным выводом данных.

Источник [7]

Автор: mefdayy

Источник [8]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/15528

URLs in this post:

[1] предлагает два типа аннотаций: https://docs.mistral.ai/capabilities/OCR/annotations/

[2] зрения: http://www.braintools.ru/article/6238

[3] обучению: http://www.braintools.ru/article/5125

[4] la Plateforme: https://docs.mistral.ai/

[5] le Chat: https://chat.mistral.ai/

[6] Компания Mistral впервые представила свой API для оптического распознавания текста в марте 2025 года: https://the-decoder.com/mistral-ai-launches-new-ai-ocr-feature-with-impressive-results/

[7] Источник: https://the-decoder.com/mistrals-document-ai-extracts-text-from-documents-and-notes-with-high-accuracy/

[8] Источник: https://habr.com/ru/companies/bothub/news/912370/?utm_source=habrahabr&utm_medium=rss&utm_campaign=912370

www.BrainTools.ru

Rambler's Top100