OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов
Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions. В этой статье расскажу про свой опыт работы с
Janus Pro: сравнение генераций и image-to-text с Stable Diffusion, Dalle и ChatGPT
Появились первые тесты новой модели Janus Pro — она не только генерирует изображения, но и распознаёт их в режиме image-to-text, описывая детали в виде осмысленных комментариев.Сегодня мы изучим, как Janus Pro (7B) справляется с генерацией изображений по сравнению с Stable Diffusion 3 (Medium) и Dalle-3

