Gemini может анализировать и суммировать видеофайлы в Google Drive
В Google Drive внедрили новые функции искусственного интеллекта Gemini, которые позволят предоставить пользователям Workspace больше информации о сохранённых ими видео. Функция Gemini AI ранее суммировала документы и PDF-файлы в Google Drive, но теперь работает и с видеофайлами.
Разработчики из Стэнфорда представили FramePack — локальную систему генерации видео на потребительских видеокартах
Исследователи из Стэнфордского университета представили FramePack — архитектуру для локальной генерации видео на потребительски видеокартах. Разработчики отмечают, что для работы системе достаточно всего 6 ГБ видеопамяти.
Я увидел будущее контента. And it is no good
Недавно я медленно смотрел Youtube. Уже не помню с какого видео я увидел сбоку в ленте рекомендацию: Amelia Erhart Mystery Finally Solved, And It's Not Good.
Апскейл видео из SD (DVD) в FullHD-4K современными нейросетями
Меня давно интересовала тема апскейла изображений, отдельно - апскейла старых видео. Одно из первых решений, которое попалось в руки несколько лет назад - waifu2x (https://github.com/nagadomi/waifu2x). Но эта нейронка больше подходила для апскейла аниме (насколько я помню на них она и тренировалась). То есть, waifu2x подходила для довольно простых изображений без избытка деталей и сложности текстур.Затем я поизучал ESRGAN (https://github.com/xinntao/ESRGAN) и Real-ESRGAN (https://github.com/xinntao/Real-ESRGAN
Instagram** запустил Edits — приложение для редактирования видео, похожее на CapCut
Meta*Бесплатное приложение Edits от Meta* позволит авторам находить идеи для видео, вдохновение для нового контента и создавать клипы с эффектами и инструментами искусственного интеллекта, пишет TechCrunch. Приложение Edits уже доступно для скачивания на iOS и Android.
Состоялся релиз SkyReels V2 — открытой модели для генерации видео по текстовому описанию
Разработчики SkyworkAI выпустили SkyReels V2 — открытую модель для генерации видео по текстовому описанию. В бенчмарке VBench нейросеть опережает OpenSora 2.0 и HunyuanVideo.
Разработчики из Tencent выпустили Hunyuan Portrait — нейросеть, которая анимирует портреты
Исследователи Университета Цинхуа, Гонконгского университета науки и технологий, Университет имени Сунь Ятсена и компании Tencent представили Hunyuan Portrait — нейросеть, которая анимирует портреты людей. Модель справляется с задачей лучше конкурентов.
Модель генерации видео Veo 2 от Google появилась в Gemini
Google предлагает свою модель искусственного интеллекта для создания видео Veo 2 пользователям, оплатившим Gemini Advanced — премиум-план компании на базе искусственного интеллекта. Расширение происходит в то время, когда Google пытается предоставить ответ на платформу генерации видео Sora от OpenAI, и поскольку конкуренция в этой области становится все более жесткой.
Стартап LiveKit получает $45 млн на развитие облачной платформы для потоковой передачи мультимедиа
Для многих технологических компаний проблемой является доставка пользователям мультимодальных данных с высокой пропускной способностью — например, одновременного аудио и видео — в режиме реального времени без перерывов. Некоторые компании разрабатывают решения внутри компании, но они часто требуют большого объема обслуживания и ремонта.
Google пополнилась улучшенными моделями генерации медиаконтента: Lyria, Veo 2 и Chirp 3 доступны избранным клиентам
В среду Google выпустила обновления для нескольких своих собственных моделей искусственного интеллекта для генерации медиаконтента, доступных через облачную платформу Vertex AI. Lyria, модель Google text-to-music, теперь доступна в предварительном просмотре для избранных клиентов, а модель создания видео Veo 2 компании была улучшена новыми возможностями редактирования и настройки визуальных эффектов.

