картинки.

Как компании-разработчики ИИ столкнулись с обвинениями в краже картинок и текстов (и что из этого вышло)

продолжить чтение

Пользователи Reddit нашли незаметные водяные знаки на картинках, сгенерированных в Gemini

На Reddit пользователи рассказали про скрытые водяные знаки, которыми Gemini помечает сгенерированные картинки. Чтобы их увидеть, надо повысить насыщенность картинок.

продолжить чтение

Данные не кончатся: как LLM навсегда изменили сбор и разметку мультимодальных данных и привели нас к SynthOps

Привет! Эта статья посвящена синтетическим данным и тому, как сбор данных и их разметка изменились навсегда. Поговорим про мультимодальную синтетику (аудио и изображения), генераторы, валидаторы, примеры классных генераций, датасеты, роль LLMок в этих процессах и трансформацию привычных пайпланов в концепцию SynthOps, которая требует других подходов по работе с данными. Я достаточно долгое время разрабатывал софт для разметки всего и вся любой сложности, рассказывал про то как LLMки пришли на замену (или помощь) людям в текстовых и мультимодальных данных

продолжить чтение

Тест-драйв Nano Banana (Gemini 2.5 Flash Image): новый фотошоп и революция в редактировании изображений от Google

продолжить чтение

Rambler's Top100