распознавание документов.

Ваш KYC не работает: почему цифровые подделки документов стали опаснее бумажных

Когда говорят о подделке документов, обычно подразумевают попытку обмануть человека. Но сегодня документы все чаще проверяют не сотрудники банков и служб безопасности, а алгоритмы цифрового онбординга, KYC и удаленной идентификации.Поэтому появились подделки нового типа — рассчитанные не на людей, а на компьютеры. Их задача не выглядеть идеально, а заставить систему распознавания извлечь нужные реквизиты и пропустить заявку дальше.Как выглядят такие атаки, почему существующие решения часто оказываются к ним не готовы и зачем мы создали открытый датасет цифровых подделок документов MIDV-DM — расскажем под катом.

продолжить чтение

Специалист против универсала: GLM‑OCR читает таблицы, которые Gemma 4 выдумывала

В первой части локальная Gemma 4 на мыльной таблице сочинила целую строку зарплат, а на гигантской — насыпала гладких круглых тысяч вместо реальных чисел. В комментариях читатель сказал: для OCR таблиц бери специальную модель, GLM‑OCR, она и меньше, и точнее. Я взял. На той же строке, которую Gemma выдумала, GLM прочитала всё верно.Откуда это вообще взялосьСтатью я писал не про «Gemma — лучший OCR» (она им не является), а про карту: где у общего локального VLM ломается зрение и как это ловить. И в комментарии badsynt

продолжить чтение

Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

На машиностроительном производстве расчет стоимости детали начинается с чертежа. Входящий запрос выглядит так: PDF и строчка «нужно 50 штук». Чтобы назвать цену, технолог открывает чертеж и вручную снимает параметры: тип детали, габариты, квалитеты, шероховатости, резьбы, материал, массу. Один чертеж — от 5 до 15 минут. При потоке в несколько десятков запросов в день это основная нагрузка на технолога.

продолжить чтение

Как из факапа родился продукт: история EasyDoc

Привет, Хабр! Меня зовут Вадим Петросян, я директор по развитию бизнеса в ITFB Group

продолжить чтение

Дипфейки бьют по кошелькам: Smart Engines представила «Шерлока 3о» против мошенничества со сгенерированными документами

Smart Engines представила первое комплексное решение для выявления дипфейков документов — «Шерлок 3о». Система детектирует поддельные изображения, созданные с помощью современных генеративных моделей, включая NanoBanana, ChatGPT, Grok, Qwen, Midjourney, Stable Diffusion, Flux и еще 20 других. Технология ориентирована на компании, которые обязаны проводить идентификацию клиентов и противодействовать мошенничеству в соответствии с регуляторными требованиями. Обновленное решение проверяет документы на подлинность по 600 признакам и используется в банках и МФО — организациях, наиболее подверженных подобным атакам.

продолжить чтение

ITFB Group вошла в рейтинг крупнейших игроков рынка СЭД России по версии CNews

ITFB Group заняла 13-е место в рейтинге «Крупнейшие игроки рынка СЭД в России

продолжить чтение

НПФ «Будущее» и ITFB Group автоматизировали 142 тысячи документов с ITFB EasyDoc

НПФ «Будущее» и ITFB Group завершили крупнейший в России проект по интеллектуальному распознаванию и обработке документов. На базе платформы 

продолжить чтение

Раньше в Ancestry оцифровывали документы 9 месяцев. Теперь ИИ справляется за 9 дней

Сказать, что база данных Ancestry обширна, — значит не сказать ничего.«Мы собрали более 65 млрд записей из 80 с лишним стран

продолжить чтение

Генератор синтетических документов для обучения моделей ИИ

Где взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.Кратко:Генератор создает синтетические PNG-картинки сканированных документов с разметкой. Ссылка на гитхабЯзык текста: можно выбрать.

продолжить чтение

Content AI и РозумСофт объединили технологии для точного распознавания документов

10 июня 2025 — многофункциональный инструментарий для разработчиков ContentReader Engine для операционной системы Linux был успешно протестирован и интегрирован с сервисом CORRECT. Компании РозумСофт и Content AI договорились о развитии сотрудничества для усиления позиций на рынке OCRIDP-решений, комбинируя свои технологические преимущества.Что дает интеграция с ContentReader Engine?Специализированный движок ContentReader Engine обеспечивает облачный сервис CORRECT новыми возможностями:·       Быстрое и точное распознавание текста, штрихкодов и др.·      

продолжить чтение

12