Монтаж видео через Claude Code
Разбираю архитектуру открытого проекта от browser-use: как заставить LLM монтировать без необходимости «смотреть» видеоКогда речь заходит про обработку видео нейросетями, у большинства из нас в голове всплывает одна и та же картина: модель смотрит на кадры, что-то понимает на основе изображения, режет по визуальным признакам. На практике это упирается в простую арифметику. Часовое видео в 30 fps — это 108 000 кадров. Если каждый кадр стоит хотя бы 1500 токенов, получаем 162 миллиона токенов на одно видео. Никакая модель столько не возьмёт за один проход, а если резать на куски — теряется глобальный контекст.
Вайбкодим .EXE под Windows с GUI на AutoHotkey v2
Продолжая изучать тему вайбкодинга для пет проектов на личном опыте и все еще находясь под впечатлением от предыдущей быстрой разработки, когда благодаря нейросетям без особых навыков программирования за пару вечеров удалось сделать консольную CMD утилиту для переконвертации семейного фото и видео архива за 15 лет, добившись сокращение его объема на жестком диске более чем в 3 раза!
Вайбкодинг на практике: пишем оптимизатор медиа архива для Windows на .BAT с помощью Gemini, ChatGPT и Qwen
Начитавшись за последние пару месяцев статей про вайбкодинг и воодушевившись, что сейчас в микрофон ноута скажу «ОК Гугл, сделай мне скрипт для кодирования фото и видео архива» и далее как в фильме Она (2013), нейросеть мне разберет по полочкам, то что откладывалось 15 лет.. Но дальше я столкнулся с суровой реальность:(
Разработчики FFmpeg добились блокировки репозитория Rockchip на GitHub по DMCA
Разработчики FFmpeg добились страйка по DMCA репозитория платформы обработки медиафайлов Rockchip после двухлетнего ожидания исправления лицензии. GitHub заблокировал репозиторий после того, как разработчик FFmpeg подал уведомление о нарушении авторских прав.
Команда проекта FFmpeg обратилась к Google: финансируйте нас или прекратите отправлять баги (CVE-slop) с помощью ИИ
Команда FFmpeg
FFmpeg добавит функцию расшифровки аудио через OpenAI Whisper
Стало известно, что мультимедийный инструмент FFmpeg получит встроенную возможность автоматической расшифровки речи, используя искусственный интеллект
Система поиска уязвимостей с ИИ Google Big Sleep обнаружила 20 багов в опенсорсных проектах
Система поиска уязвимостей с искусственным интеллектом Google Big Sleep обнаружила 20 багов в проектах с открытым исходным кодом, включая аудио- и видеобиблиотеку FFmpeg и пакет для редактирования изображений ImageMagick.
Как я гифку с помощью ИИ сжимал
обложкаВступлениеПривет, Хабр! Я графический дизайнер. Занимаюсь созданием сайтов, иллюстраций, немного работаю с видео и в качестве хобби увлекаюсь 3D. Я никогда не считал себя программистом. Да, я умею читать код, понимаю его логику, но вот так, чтобы самостоятельно сесть и написать что‑то с нуля... до недавнего времени это казалось мне чем‑то запредельным.Проблема

