обработка документов.

Deepseek OCR 2 сокращает количество визуальных токенов на 80%

Китайская компания Deepseek, специализирующаяся на искусственном интеллекте, представила новый кодировщик изображений, который перестраивает информацию на основе смысла, а не обрабатывает ее в жестком порядке сверху вниз и слева направо.

продолжить чтение

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи, людям недоступные

продолжить чтение

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

продолжить чтение

Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.Проблема, с которой мы столкнулись

продолжить чтение

Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг». При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний мы автоматизировали в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM).

продолжить чтение

Эффективное использование LLM в командной строке

ЗачемИспользование ИИ проникло уже во все возможные сферы в ИТ. Мы применяем LLM модели как через Web так и подключая через специальный API в программном коде. Запускаем агентов кодогенерации и реализации других практических задач через специальные плагины или отдельные приложения. Рассмотрим ещё один интерфейс работы с GenAI — командную строку. Сразу предупрежу, мы не будем рассматривать код-агенты вроде Claude Code или AI-терминалы вроде Warp.

продолжить чтение

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

В прошлой статье

продолжить чтение

СontentCapture+LLM: как мы ускорили работу с неструктурированными документами

В эпоху цифровой трансформации каждая минута работы с документами на вес золота. Юридические отделы, банки, госучреждения ежедневно обрабатывают сотни договоров, доверенностей и судебных приказов. Ручной ввод данных, поиск реквизитов и проверка сроков могут отнимать до 20 минут на документ — и это если сотрудник не отвлекся на кофе. В нашей линейке продуктов есть универсальная IDP-платформа ContentCapture

продолжить чтение

Document AI от Mistral извлекает текст из документов и заметок с высокой точностью

Mistral AI представляет Document AI — модульную платформу для автоматизированной обработки документов, которая сочетает в себе распознавание символов, вывод структурированных данных и обработку естественного языка с гибкими вариантами развертывания.

продолжить чтение

Rambler's Top100