Обработка изображений. - страница 8

Сравнение графических нейросетей: Nano Banana, Seedream v4 и Reve

Рынок графических нейросетей расширяется, причём их возможности растут в геометрической прогрессии. Совсем недавно появилась новая версия Nano Banana, чуть раньше - Seedream v4 и Reve.Я подумал: почему бы не сравнить эти три модели? Уровни генерации у них примерно одинаковы, возможно, получится что-нибудь любопытное.Итак, сегодня мы рассмотрим: Nano Banana (берём первую версию, вторая была бы слегка не равноценна по отношению к конкурентам), Seedream v4 и Reve. Постараемся осветить некоторые интересные возможности, если они имеются, а также попробуем определить, какая из моделей справляется лучше с поставленными задачами.

продолжить чтение

Гайд по нейро-рекламе: Как ИИ спасает даже самые безнадежные объявления на Авито

Авито — это не просто доска объявлений. Это настоящий музей народного творчества, странных ракурсов и загадочных предметов. Мы все видели эти фото: размытый диван в темноте, «селфи» чайника в зеркале или ковер, который видел еще Брежнева.Но что, если бы наши продавцы имели доступ к технологиям будущего? 🤔Мы решили провести эксперимент. Взяли самые колоритные (и случайные!) объявления и попросили Искусственный Интеллект переосмыслить их визуал. Никакого сложного фотошопа, только магия нейросетей и чатбота.⚠️

продолжить чтение

Дискретные дифференциальные операторы

Каждый раздел содержит по три подраздела: непрерывный случай, дискретный случай и кросс-корреляция.Производная первого порядкаНепрерывный случай. Производная функции

продолжить чтение

Японцу грозит суд за копирование защищённых копирайтом картинок с помощью ИИ

В Японии 27-летнему мужчине грозит уголовная ответственность после того, как он использовал Stable Diffusion для воссоздания иллюстрации, защищённой авторским правом. Затем мужчина продал результат в качестве обложки книги. 

продолжить чтение

Nano Banana Pro — почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

20 ноября состоялся официальный

продолжить чтение

Конвейеры формирования изображений. Часть 1: Регистрация света и дебайеринг

Приветствую! Я, Егор Ершов, руководитель группы «Цветовая вычислительная фотография» в AIRI и заведующий сектором репродукции и синтеза цвета ИППИ РАН, продолжаю выкладывать статьи по мотивам своих лекций по вычислительной фотографии. Наша глобальная задача, напомню, разобраться, как сделать так, чтобы камера сотового телефона достаточно хорошо смогла уловить цвета, а монитор или принтер — их передать. Прошлые три текста были посвящены общей теории цвета, описанию зрительной системы, а также стандартам и цветовым пространствам (их можно прочесть тут,

продолжить чтение

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

Привет, Хабр! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе.Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

продолжить чтение

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

продолжить чтение

Google Photos позволит пользователям iPhone редактировать изображения с помощью текста

Google выпускает несколько обновлений ИИ для своего приложения Photos, включая поддержку диалогового редактирования для iOS, более точное редактирование лиц и новые инструменты. 

продолжить чтение

Как началась патентная гонка за технологиями дипфейков

Само слово «дипфейк» (deepfake) впервые появилось в 2017 году на платформе Reddit. Однако технологическая основа была заложена еще в 2014 году с изобретением генеративно-состязательных сетей (GANs) Яном Гудфеллоу. 

продолжить чтение

1...67891011...20...21