обработка документов.

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions. В этой статье расскажу про свой опыт работы с

продолжить чтение

Content AI объединила IDP и RPA в платформе ContentCapture

Компания Content AI, российский разработчик ИИ-решений для автоматизации бизнес-процессов, выпустила новую версию платформы ContentCapture, в которой объединены интеллектуальная обработка документов (IDP) и роботизация процессов (RPA). Раньше для таких задач требовались два отдельных продукта от разных вендоров; интеграция между ними увеличивала стоимость проекта на 30–50%. В новой версии оба инструмента доступны в рамках одного решения и одной лицензии. 

продолжить чтение

Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе — и почему «универсальный подход» не сработал. Вначале было... 2 часа на одну карту контроляПредставьте металлургическое предприятие полного цикла: 3200 человек и 4500 тыс номенклатуры, которая все время добавляется....Как раньше происходила подготовка к испытаниям? Технолог открывал ГОСТ (или ОСТ, или другой нормативный документ), находил таблицу, подставлял в нее параметры номенклатуры, например, диаметр поковки. Находил нужное значение контроля и записывал в карту ... Дальше технолог повторял эту процедуру для 40+ параметров контроля.

продолжить чтение

От OCR до ADE: как машины научились не просто читать, а понимать документы

Представьте что вы получили 500 кредитных заявок. В каждой — паспорт, банковская выписка, справка о доходах, налоговая форма. Всё в PDF. Имена файлов: upload1.pdf, upload2.pdf... Чтобы обработать их вручную — нужна неделя и несколько сотрудников. Чтобы обработать автоматически старым способом — нужно написать отдельный парсер под каждый тип документа, и молиться чтобы шрифт не поменялся. Эта статья о том как индустрия шла к решению этой задачи — и к чему пришла.

продолжить чтение

Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

AI и LLM сейчас на пике популярности. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы?

продолжить чтение

Deepseek OCR 2 сокращает количество визуальных токенов на 80%

Китайская компания Deepseek, специализирующаяся на искусственном интеллекте, представила новый кодировщик изображений, который перестраивает информацию на основе смысла, а не обрабатывает ее в жестком порядке сверху вниз и слева направо.

продолжить чтение

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи, людям недоступные

продолжить чтение

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

продолжить чтение

Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.Проблема, с которой мы столкнулись

продолжить чтение

Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг». При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний мы автоматизировали в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM).

продолжить чтение

12