Открытый исходный код Kimi-VL от Moonshot AI обрабатывает текст, изображения и видео всего с 2,8 миллиардами параметров
Новая модель AI с открытым исходным кодом от китайского стартапа Moonshot AI обрабатывает изображения, текст и видео с удивительной эффективностью. Kimi-VL выделяется своей способностью обрабатывать длинные документы, сложные рассуждения и понимание пользовательского интерфейса.
Seedream 3.0: новая модель преобразования текста в изображение от ByteDance
ByteDance представляет Seedream 3.0 — новую модель преобразования текста в изображение. Тесты показывают, что она превосходит GPT-4o и Midjourney по скорости, точности и качеству изображения.
Пользователям ChatGPT стала доступна галерея сгенерированных изображений
OpenAI добавила в ChatGPT галерею сгенерированных изображений. В ней пользователи могут получить доступ ко всем созданным картинкам и не искать их в разных чатах.
OpenAI отключает генерацию видео для некоторых пользователей Sora из-за проблем с емкостью
OpenAI все еще пытается преодолеть проблемы с пропускной способностью, вызванные функцией генерации вирусных изображений, которую компания запустила на прошлой неделе.
Критикующая цитата Миядзаки об AI вновь в центре дискуссии после работ Альтмана в стиле Ghibli
В социальных сетях вновь появилась цитата основателя студии Ghibli Хаяо Миядзаки от 2016 года, в которой он назвал AI «совершенно отвратительным» и «оскорблением жизни», однако это заявление касалось именно демонстрации анимации с использованием AI, а не современной технологии генерации изображений.
InfiniteYou от ByteDance позволяет пользователям создавать неограниченное количество вариаций портретных фотографий
Компания ByteDance разработала новый подход к созданию портретов с помощью ИИ, который решает такие распространенные проблемы, как непоследовательность черт лица и плохое следование подсказкам.
Люди используют новую модель искусственного интеллекта Google для удаления водяных знаков с изображений
Пользователи социальных сетей обнаружили спорный вариант использования новой модели искусственного интеллекта Gemini от Google: удаление водяных знаков с изображений, в том числе с изображений, опубликованных Getty Images и другими известными стоковыми медиакомпаниями.
Модели Goku от ByteDance могут создавать реалистичные видеоролики о продуктах без участия людей-актеров
Последние модели искусственного интеллекта китайской технологической компании могут генерировать реалистичные видеоролики, на которых люди взаимодействуют с продуктами, потенциально меняя подход компаний к созданию рекламного контента.
GitHub представил Vision for Copilot: генерация кода по изображениям
GitHub анонсировал ряд обновлений для Copilot, а также дал возможность заглянуть в более агентное будущее своего парного программирования на базе искусственного интеллекта . Среди заметных обновлений — функция Vision for Copilot, которая позволяет пользователям прикреплять к чату снимок экрана, фотографию или диаграмму, а Copilot генерирует интерфейс, код и альтернативный текст для их воплощения в жизнь.
Квадратная структура на поверхности Марса породила конспирологические теории
Исследователи и пользователи Интернета активно обсуждают снимок квадратной структуры на поверхности Марса, сделанный камерой Mars Orbiter. Его опубликовали на сайте Mars Image Explorer Университета штата Аризона.

