ocr. - страница 2

ocr.

VLM vs IDP (хайп vs конвейер): кто выигрывает в гонке за точностью и эффективностью

продолжить чтение

Как мы научили нейросеть читать технические схемы и сразу считать их стоимость

Танцы с YOLO, OCR и пятнами от кофеКогда думаешь о «цифровой трансформации» в промышленности, в голове обычно всплывают роботы, датчики, большие экраны и дроны, которые сами разносят детали по цеху. В реальности всё часто упирается в куда более прозаичные вещи.

продолжить чтение

End-to-end вместо трёх костылей: как мы обошли OCR и выиграли по скорости и точности

Привет, чемпионы!

продолжить чтение

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

продолжить чтение

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Кадр из фильма двухсотлетний человекДанная статья описывает процесс создания проложения для распознавания текста на изображении и общения с распознанным текстом. Системные требованияЯзык: Python

продолжить чтение

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Привет, Хабр! 

продолжить чтение

Генератор синтетических документов для обучения моделей ИИ

Где взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.Кратко:Генератор создает синтетические PNG-картинки сканированных документов с разметкой. Ссылка на гитхабЯзык текста: можно выбрать.

продолжить чтение

Что будет, если пригласить на свидание OCR и GPT?

Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics, со мной Александр Сулейкин, Founder DUC Technologies

продолжить чтение

Content AI и РозумСофт объединили технологии для точного распознавания документов

10 июня 2025 — многофункциональный инструментарий для разработчиков ContentReader Engine для операционной системы Linux был успешно протестирован и интегрирован с сервисом CORRECT. Компании РозумСофт и Content AI договорились о развитии сотрудничества для усиления позиций на рынке OCRIDP-решений, комбинируя свои технологические преимущества.Что дает интеграция с ContentReader Engine?Специализированный движок ContentReader Engine обеспечивает облачный сервис CORRECT новыми возможностями:·       Быстрое и точное распознавание текста, штрихкодов и др.·      

продолжить чтение

Автоматизация без кода: как FastML справляется с документами за несколько кликов

Привет, Хабр!В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесь

продолжить чтение

Rambler's Top100