Обработка изображений. - страница 4

«Яндекс» научил свою умную IP-камеру понимать происходящее в кадре с помощью ИИ

продолжить чтение

Nano Banana Pro vs SeeDream 4.5 vs GPT-5: битва моделей для генерации изображений. Кто победит в 2025 году?

Доброго времени суток, «Хабр»!Не так давно у меня вышла статья о сравнении топовых моделей для генерации текста (к сожалению, на данный момент её уже нельзя назвать самой актуальной). И вот у меня возникла идея - провести аналогичное сравнение для новых моделей в сфере генерации изображений, ведь и эта ниша развивается бешеными темпами.Сегодня в битве участвуют: Nano Banana Pro, SeeDream 4.5 и GPT-5 Image. Делайте ставки, а я приступаю к сравнению этих впечатляющих моделей.

продолжить чтение

LongCat-Image доказывает, что 6 миллиардов параметров могут превзойти более крупные модели с лучшей обработкой данных

продолжить чтение

Российские физики научились восстанавливать скрытые детали на зашумленных интерферограммах с высокой точностью

продолжить чтение

В ChatGPT появился Photoshop и другие продукты Adobe. Почему это провал — разбираем

Я дико обрадовалась, когда узнала, что Adobe заколабились с ChatGPT, и стало возможным через коннекторы подсоединить Photoshop (редактирование изображений), Adobe Express (создание дизайна и контента) и Acrobat (работа с PDF-файлами) и в интерфейсе ChatGPT творить дела. Но лично моя радость была недолгой - полное разочарование: 1) Adobe Photoshop

продолжить чтение

Реализуем компьютерное зрение на практике

На тему компьютерного зрения есть множество различных публикаций, которые в основном рассказывают о применении этой технологии в разных отраслях. Однако, зачастую публикации содержат лишь общую информацию о том, что реализовано и для каких задач, но при этом отсутствует описание того, как это можно сделать.В нашей статье мы поговорим о том, как можно реализовать на Python навигационную систему на основе машинного зрения для автономных транспортных средств, проанализировать медицинские изображения и выполнить генерацию новых изображений из набора данных уже существующих.

продолжить чтение

Зрительно-языковые модели читают хуже (или лучше), чем вам кажется

Знакомство с бенчмарком ReadBench, позволяющим без труда оценить, насколько хорошо ваши любимые зрительно-языковые модели читают изображения с большими объёмами текста.В этой статье будет рассказано о ReadBench. ReadBench — это очень простой бенчмарк, который мы разработали для оценки важного, но недооценённого аспекта мультимодального ИИ: насколько хорошо моделям удаётся, собственно, читать текст на картинках, рассуждать о нём и извлекать информацию из таких изображений, на которых много текста.

продолжить чтение

Nano Banana 2 vs ChatGPT: сравниваем эволюцию в генерации AI изображений за полгода

Прошло полгода с момента релиза прорывной на тот момент генеративной модели от OpenAI и 5 месяцев с того момента, как я выложил статью 20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерахВ этой большой статье хочу показать то, как улучшилась генерация за это времяПрелюдияСразу с момента релиза у генераций ChatGPT были проблемы в этих направлениях ⤵️Консистентная перегенирация лиц или других объектов, если хочется делать стабильно. На фоне этого было создано огромное кол-во стартапов, тот же higgsfield.ai со своим Soul ID

продолжить чтение

Инструмент OpenAI получит доступ к фотографиям детей в игре отслеживания Санта-Клауса

В это Рождество OpenAI объединится с Американским командованием воздушно-космической обороны (North American Aerospace Defense Command, NORAD), чтобы предложить детям и их родителям несколько игр для отслеживания Санта-Клаус. Однако в рамках этого проекта компания получит доступ к фотографиям детей.

продолжить чтение

Данные против модели: почему больше — не всегда значит лучше в задаче Face Antispoofing

продолжить чтение

1...234567...18
Rambler's Top100