- BrainTools - https://www.braintools.ru -
Начитавшись за последние пару месяцев статей про вайбкодинг и воодушевившись, что сейчас в микрофон ноута скажу «ОК Гугл, сделай мне скрипт для кодирования фото и видео архива» и далее как в фильме Она (2013), нейросеть мне разберет по полочкам, то что откладывалось 15 лет.. Но дальше я столкнулся с суровой реальность:(
Все никак не доходили руки разобрать семейный цифровой архив фото и видео за 15 лет. Десятки папок, сотни гигабайт медиа данных. Разношерстный контент — от видео с древних зеркалок с избыточным битрейтом до HEIC изображений с современных смартфонов.
Решил писать на нативном Batch (CMD), чтобы скрипт работал на любой Windows‑машине «из коробки» без установки Python или Node.js. В качестве движков нейронка на стадии обсуждения предложила консольную версии FFmpeg для видео и jpg и даже установила его сама в скрипте через winget позже пришлось еще подключать ImageMagick для heic, который через ffmpeg обрабатывался некорректно.
Я не использовал IDE с AI‑плагинами, только чат, выступая в роли менеджера с компетенциями разработчика, но не программиста, в итоге сам не написал ни строчки кода, но иногда приходилось указывать сети в какой части кода нужно исправлять баг чтобы она меньше галлюцинировала. Использовал следующие технологии:
Поскольку на Google One уже есть подписка и она тесно интегрирована в сервисы Android, я начал с этой нейронки, обсудив стек технологий и общие задачи. Она отлично справилась с обсуждением и MVP. Сгенерировал с ней за вечер скелет на 500 строк и базовую логику [1].
Скрипт уже работал с жестко заданными параметрами и за ночь обработал несколько десятков гигибайт данных, подтвердив жизнеспособность гипотезы. Но как только ТЗ усложнилось (добавил больше настраиваемых по ходу работу параметров, возможность запуска из консоли через CLI, Drag & Drop, обработку длинных путей файлов на кириллице), модель поплыла. Начались галлюцинации: код терял куски логики, модель постоянно пыталась его сократить, чинила одно и ломала другое даже когда явно писал что делать, новые диалоги и скелет тз с описанием логики не помогали, Gemini 3 забывала, что мы фиксили 5 сообщений назад и снова это ломала, в результате за второй вечер я пришел к выводу, что небольшие усложнения скрипта в области настроек и параметров уперлись в потолок сообразительности этой нейронки и попробвал следующую.
На ChatGPT у меня кончилась подписка, так как в последнее время для повседневных задач мне хватает гугла, но он продолжал работать в полном режиме с ограниченным количеством токенов в день, так что я попробовал его использовать для рефакторинга и фикса багов. И честно говоря помогло слабо, буквально после 1–2 фикса начиналсиь примерно такие же баги как у гугла. Примечательно что он отвечал почти мгновенно, очевидно начиная работать над задачей еще до того как я закончу полностью писать очередное ТЗ в окне задачи и нажму Enter. Однако я быстро уперся в суточный потолок токенов и активные попытки склонить меня к новой супер подписке по скидке и чуда даже от последней версии для кода под Windows не увидел. Хотя до этого создавал с его помощью короткие скрипты и конфигурацию сервисов для Linux Shell намного проще чем сейчас шло под Windows.
На днях попадалась статья что китайцы сильно прокачали свою сеть в области обработки изображений, решил проверить как она справится с кодом. И не пожалел. Qwen смогла проглотить весь забагованный код, поняла логику, намного подробнее расписала комментарии на каждый блок и провела грамотный рефакторинг. Она дописала систему меню, корректную обработку аргументов и пофиксила процедуры с которыми были проблемы у американских сетей ошибаясь раза в три меньше. Итоговый скрипт вырос почти до 1000 строк и заработал стабильно, однако на этом объеме данных и тут начались галлюцинации — при попытке добавить новые функции, такие как более точный расчет времени работы и дополнительных проверок все начало опять сыпаться и новые диалоги не помогали. Так что я сделал вывод что на текущий момент уровень сложности и в этой сети достигнут.
В итоге за 3 вечера «вайб‑кодинга», который честно говоря был вообще не вайб и не изи, получился.BAT скрипт
Media Optimizer - скрипт для обработки фото и видеоMedia Optimizer
Полная автоматизация установки: сам ставит FFmpeg/ImageMagick если их нет в системе
Два режима:
Drag & Drop папки или ручной запуск.
CLI: Для запуска по расписанию/в пайплайнах.
Логика работы:
Рекурсивный обход любой глубины вложенности.
Зеркалирование структуры папок в целевую директорию (включая копирование не-медиа файлов, вроде текстовых заметок или нестандартных форматов, если нужно).
Видео: Конвертация в H.264/H.265 с использованием NVIDIA NVENC (автодетект GPU).
Фото: Ресайз и компрессия визуально без потери качества, в итоге фото выглядят даже лучше чем со старых камер, открываются быстрее, а места занимают раза в 3 меньше.
Защита от перезаписи (пропуск уже существующих файлов).
Самое главное — результат, ради которого всё затевалось.
Скрипт был запущен на обработку всего 15-летнего архива.
Время: 2 ночи работы ПК
Эффективность: Общий объем архива уменьшился более чем в 3 раза.
Старые видео с зеркалок сжались до 10 раз.
Современные фото/видео — в 2–4 раза.
Качество: Визуально на 2K мониторе разницы между исходником не видно.
Код выложил на GitHub [2], пользуйтесь. Для новых апдейтов машинным способом вероятно уровень нейронок должен подрасти, но это уже отличный прогресс, год назад я генерировал изображения с некорректным числом пальцев…
Кстати, сколько подобное решение заняло бы времени у продвинутого сисадмина не программиста вручную? И справились бы вы без нейронок? Я вот откладывал 15 лет…. )
Автор: Micha1l
Источник [3]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/25536
URLs in this post:
[1] логику: http://www.braintools.ru/article/7640
[2] выложил на GitHub: https://github.com/micha1l-31337/media-optimizer/
[3] Источник: https://habr.com/ru/articles/995582/?utm_campaign=995582&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.