Создаем датасет печатных букв с любым шрифтом за 170 строк
Всем привет, это моя первая статья на Хабре. В этой статье я хочу рассказать, как сгенерировать датасет печатных букв с помощью .ttf файла и кода на Python в 170 строк.Зачем?
Sony будет добавлять к снимкам цифровые подписи C2PA для верификации
Sony объявила, что запустит функцию Camera Verify для верификации фотографий. Она позволит организациям решать растущую проблему проверки подлинности цифровых изображений в эпоху генеративного искусственного интеллекта.
Новая версия DLSS от Nvidia обеспечивает снижение потребления VRAM на 20%
Nvidia оптимизировала
OmniGen 2 сочетает в себе генерацию изображений и текста, как GPT-4o, но имеет открытый исходный код
Исследователи из Пекинской академии искусственного интеллекта выпустили OmniGen 2 — систему с открытым исходным кодом для преобразования текста в изображение, редактирования изображений и создания контекстных изображений.
Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением
"Распознать бы этого шакала"
Google выпустила бесплатную модель Imagen 4 для перевода текста в картинку
Google объявила о выпуске новой модели Imagen 4, которая позволит генерировать картинки по текстовому описанию. Она выпускается бесплатно, но доступна только в AI Studio и в течение «ограниченного времени».
Новый метод позволяет физически восстановить оригинальные картины с помощью цифровых плёнок
Аспирант факультета машиностроения в Массачусетском технологическом институте Алекс Качкин представил новый метод, который он разработал для физического переноса результатов цифровой реставрации непосредственно на оригинальную картину.
Content AI и РозумСофт объединили технологии для точного распознавания документов
10 июня 2025 — многофункциональный инструментарий для разработчиков ContentReader Engine для операционной системы Linux был успешно протестирован и интегрирован с сервисом CORRECT. Компании РозумСофт и Content AI договорились о развитии сотрудничества для усиления позиций на рынке OCRIDP-решений, комбинируя свои технологические преимущества.Что дает интеграция с ContentReader Engine?Специализированный движок ContentReader Engine обеспечивает облачный сервис CORRECT новыми возможностями:· Быстрое и точное распознавание текста, штрихкодов и др.·
Новый вид контента: ИИллюстрированная аудиокнига
Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать длинные видео, но ведь можно экранизировать аудиокниги с помощью серии иллюстраций! Эта идея меня захватила, и я написал небольшой проект Ai-llustrator, которым хочу здесь поделиться.Вот пример результата: Артур Кларк — «Девять миллиардов имён Бога»

