Обработка изображений. - страница 15

Создаем датасет печатных букв с любым шрифтом за 170 строк

Всем привет, это моя первая статья на Хабре. В этой статье я хочу рассказать, как сгенерировать датасет печатных букв с помощью .ttf файла и кода на Python в 170 строк.Зачем?

продолжить чтение

Sony будет добавлять к снимкам цифровые подписи C2PA для верификации

Sony объявила, что запустит функцию Camera Verify для верификации фотографий. Она позволит организациям решать растущую проблему проверки подлинности цифровых изображений в эпоху генеративного искусственного интеллекта.

продолжить чтение

VisionLabs и MWS Cloud тестируют Luna Scanner — систему автоматического обнаружения угроз в местах скопления людей

продолжить чтение

Новая версия DLSS от Nvidia обеспечивает снижение потребления VRAM на 20%

Nvidia оптимизировала

продолжить чтение

OmniGen 2 сочетает в себе генерацию изображений и текста, как GPT-4o, но имеет открытый исходный код

Исследователи из Пекинской академии искусственного интеллекта выпустили OmniGen 2 — систему с открытым исходным кодом для преобразования текста в изображение, редактирования изображений и создания контекстных изображений.

продолжить чтение

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

"Распознать бы этого шакала"

продолжить чтение

Google выпустила бесплатную модель Imagen 4 для перевода текста в картинку

Google объявила о выпуске новой модели Imagen 4, которая позволит генерировать картинки по текстовому описанию. Она выпускается бесплатно, но доступна только в AI Studio и в течение «ограниченного времени».

продолжить чтение

Новый метод позволяет физически восстановить оригинальные картины с помощью цифровых плёнок

Аспирант факультета машиностроения в Массачусетском технологическом институте Алекс Качкин представил новый метод, который он разработал для физического переноса результатов цифровой реставрации непосредственно на оригинальную картину.

продолжить чтение

Content AI и РозумСофт объединили технологии для точного распознавания документов

10 июня 2025 — многофункциональный инструментарий для разработчиков ContentReader Engine для операционной системы Linux был успешно протестирован и интегрирован с сервисом CORRECT. Компании РозумСофт и Content AI договорились о развитии сотрудничества для усиления позиций на рынке OCRIDP-решений, комбинируя свои технологические преимущества.Что дает интеграция с ContentReader Engine?Специализированный движок ContentReader Engine обеспечивает облачный сервис CORRECT новыми возможностями:·       Быстрое и точное распознавание текста, штрихкодов и др.·      

продолжить чтение

Новый вид контента: ИИллюстрированная аудиокнига

Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать длинные видео, но ведь можно экранизировать аудиокниги с помощью серии иллюстраций! Эта идея меня захватила, и я написал небольшой проект Ai-llustrator, которым хочу здесь поделиться.Вот пример результата: Артур Кларк — «Девять миллиардов имён Бога»

продолжить чтение

1...10...131415161718...21