image-to-text.

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions. В этой статье расскажу про свой опыт работы с

продолжить чтение

Janus Pro: сравнение генераций и image-to-text с Stable Diffusion, Dalle и ChatGPT

Появились первые тесты новой модели Janus Pro — она не только генерирует изображения, но и распознаёт их в режиме image-to-text, описывая детали в виде осмысленных комментариев.Сегодня мы изучим, как Janus Pro (7B) справляется с генерацией изображений по сравнению с Stable Diffusion 3 (Medium) и Dalle-3

продолжить чтение