- BrainTools - https://www.braintools.ru -

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом

Всем привет! Я потратил на ии кодинг 500 долларов за 10 дней работы с Девином, и в результате у меня получился онлайн редактор для АИ видео с открытым исходным кодом. Кто такой Девин, зачем я это делал и что в итоге получилось. Разбираемся ниже.

И наверное мой рассказ стоит начать с того, что я не разработчик, т.е. вообще совсем. Я конечно могу читать код и даже что-то понимать, но это просто потому что последние 20 лет занимаюсь ведением проектов в качестве продакта и проджекта. 

Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me [1], техноблогер [2] и нейро-евангелист. Так что взгляд на все будет с моей колокольни, и скорее всего он сильно отличается от взгляда профессионального разработчиков.

Что у меня получилось?

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 1

VideoSOS – это онлайн редактор для создания AI видео через популярные модели вроде VEO, Sora, Kling и других. Главная фишка – использование сервис-провайдеров по себестоимости вместо дорогих подписок, что сильно дешевле чем покупать подписки у каждого сервиса отдельно. Можно генерировать видео из текста или картинок, редактировать таймлайн с несколькими треками, экспортировать результат в разных форматах, добавлять аудио дорожки. Есть поддержка локализации на английский и русский. Работает прямо в браузере без установки.

Но давайте по порядку – зачем мне вообще это было нужно. Я регулярно создаю видео, может видели что-то в моем TikTok [6] или на YouTube [7]. Каждую пятницу на стримах исследую новые нейросети вместе с подписчиками. Работаю со всеми видео-сервисами, у меня подписки на многие из них, есть аккаунты у сервис-провайдеров.

И вот идея – как круто было бы использовать нейросети для генерации видео по себестоимости! Большие сервис-провайдеры часто предоставляют популярные нейронки по себестоимости ради привлечения клиентов. Проблема? Достало бегать между сервисами.

Конечно делать с нуля было бы самоубийством [8]. Нашел заброшенный проект от Fal (один из сервис-провайдеров): https://github.com/fal-ai-community/video-starter-kit [9]. Качество было очень не очень, сильно недоделан, не доходил до MVP по моему пониманию.

Ок, проект нашел, теперь вопрос – как его доделывать? Классический вариант – найти фрилансера. Фрилансеры просят от $500 за MVP с новыми фичами. Деньги те же самые что я в итоге потратил, а опыт [10] получу – ноль.

А мне хотелось именно поучаствовать, понять как это работает. Не просто получить готовое решение, а разобраться в процессе. Своего рода эксперимент.

Результат работы: 250 коммитов от Девина за 10 дней. Работы еще много – нужно пофиксить баги, улучшить UX, добавить больше фич. Если вы тоже генерируете видео и хотите помочь с разработкой – буду рад, проект открытый.

Поиск решения

Пробовал использовать курсор локально – мне не понравилось. Пробовал фаербейс, он работал и даже что-то получалось, но показался неприятным и недружелюбным. Использовал Ohara.ai [11] – там мне очень не хватало синхронизации с гитом.

И вот после долгих мучений и поисков я провел глубокое исследование, нашел Devin [12].

Девин это агент для кодирования и он оказался лучшим не только по тестам которые я видел, но и по моему собственному опыту. Просто потому что девин действительно работает.

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 2

Девин это не просто ассистент вроде GitHub Copilot или ChatGPT который подсказывает код. Это полноценный агент который сам пишет код, тестирует, деплоит, чинит баги. У него есть своя виртуальная машина с браузером, терминалом и редактором кода. Он сам гуглит документацию, читает код, делает коммиты в гит.

Он может работать долго, не эффективно и за ним надо приглядывать – но он работает. А это главное отличие от других инструментов которые я пробовал.

Процесс разработки

Я начинал с простых задач чтобы освоиться и разобраться во всем. Мелкие фиксы интерфейса, добавление новых моделей – прошли без проблем. С добавлением новой локализации тоже справился, но было долго.

Периодически приходится вмешиваться в его работу и следить за процессом. Девин – это не волшебная кнопка “сделай все сам”. Это скорее инструмент который требует присмотра, особенно на сложных задачах. Вы ставите задачу, он работает автономно, но вы следите за процессом и корректируете если что-то идет не так.

И это действительно не дешевое удовольствие. Они сравнивают свой агент с настоящим джуном, и возможно по стоимости они действительно сопоставимы. Но девин это джун который ждет вас дома в три часа ночи.

Не совсем так звучит как я имел ввиду, но вы поняли – это ассистент который доступен в любое время дня и ночи, если у вас есть деньги на балансе.

Давайте про деньги. Единицы кредитов называются в девине ACUs – это типа Agent Compute Units. Одна ACU стоит $2.25 на базовом тарифе. Минималка для пополнения – $20, уже серьезный стопор.

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 3

При этом диалог надо держать определенного размера. И когда диалог выходит за 5 ACU – лучше закругляться, работа станет менее эффективной и более долгой. Это как контекстное окно у GPT, только измеряется не токенами а деньгами.

К счастью девин умеет с этим помогать и всегда готов составить инструкцию для перехода в другой диалог. Типа он сам понимает когда пора остановиться, делает саммари что сделано и что надо дальше делать – просто копируешь и вставляешь в новую сессию.

Для продакта это важно понимать – делегировать можно, но надо следить. Даже если ты разработчик в отличие от меня. Просто смотришь что он делает в реальном времени через встроенную IDE, читаешь его мысли и планы. Иногда берешь управление на себя если видешь что он не туда поехал.

Возврат денег и другие фичи

Еще мне очень понравилась фишка девина в возврате денег. Я даже начал его немного абьюзить, честно говоря.

Когда дэвин делает что-то не правильно, вы его одергиваете, он извиняется и возвращает часть средств потраченных на этот диалог. И при некоторой сноровке этим даже можно злоупотреблять. Типа если видишь что он явно тупит или делает не то – можешь его остановить, написать что не так, и получить рефанд части ACU.

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 4

И я действительно обожаю эту функцию. Она не только позволяет снять негатив от неудачного использования, но и повышает лояльность к продукту. Когда ты видишь что деньги не просто улетают в никуда, а компания готова признать ошибку [13] и вернуть средства – это другое дело.

Есть конечно и минусы. Это все больше похоже на тотализатор или слот машину, где то и дело выпадает кэшбек или удачный код – в качестве джекпота. То он сделал отлично с первого раза – джекпот! То накосячил, но вернул ACU – утешительный приз. Такая себе геймификация, которая, кажется, может вызывать зависимость.

В общей сложности так я получил обратно 70 ACU, а потратил на этот проект более 200.

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 5

Что еще крутого умеет девин? Ну кроме тестирований и деплоев он умеет смотреть интернет так же как вы через браузер. И даже сам вводит капчу и ищет документацию по апи.

Но это опять же не слишком эффективно, потому что чтобы водить мышкой по экрану он похоже использует js код. Типа он не просто кликает как человек, а вводит javascript команды в консоль браузера. Работает, но медленно и не всегда надежно.

Еще одна крутая фича – автоматическое составление Wiki по проекту, которой не только пользуется сам Девин, но вы можете с ней разговаривать. Например, чтобы узнать где находится какая-то функция. 

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 6

Притом запросы к Wiki – бесплатные, вы можете заранее пообщаться с документацией, составить план действий, а потом закинуть его в Девина сэкономив немного токенов. 

Что получилось

Теперь к конкретике – что реально получилось за эти 10 дней работы. Цифры из гита говорят сами за себя – 250 коммитов, 62 пулл реквеста влито. 

Начинал я с простого – простые UI правки, интеграция новых AI моделей. Это прошло вообще без проблем, девин справлялся с первого раза. Радовался как дурак что все работает. Но работало не все, и на самом деле даже сейчас надо дотестировать, потому что некоторые схемы нуждаются в правке.

Потом делали ребрендинг проекта – меняли название везде с video-starter-kit на VideoSOS. Тут уже пришлось следить чтобы он не забыл поменять в конфигах, в метаданных, в UI. Но в целом ок.

А потом локализировали на русский язык и тут тоже не обошлось без проблем. На локализацю ушло аж 4 коммита – сначала добавили сам перевод, потом чинили роутинг для i18n, потом еще раз чинили потому что не все пути работали правильно. В общем повозились.

А вот дальше началось то самое интересное. Добавление экспорта аудио превратилось в настоящий квест. Девин пробовал разные подходы – то серверный экспорт, то клиентский через FFmpeg.wasm прямо в браузере.

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 7

И вот тут была целая эпопея – буквально 6-7 попыток с откатами. На каждом шаге что-то ломалось. То тишина вместо звука, то падает с ошибкой, то вообще не запускается. В один момент девин так накосячил что сломал вообще весь экспорт и пришлось делать полный откат назад к последней рабочей версии. Потом еще один откат. И только после этого наконец заработало через FFmpeg.wasm – щас работает, но были моменты когда я уже хотел все бросить.

Вот вам реальный пример когда простая фича превращается в многодневный баг-марафон.

Еще добавляли интеграцию с Runware.ai [14] провайдером – это должно было дать доступ сразу к 108 моделям генерации. Сама интеграция прошла нормально, но потом девин еще раза три возвращался чтобы починить – то синхронные ответы от API неправильно обрабатывались, то SDK использовали не так, то параметры забыли добавить. Вот такие доработки по мелочи.

И под конец запилили portable Windows версию [15] с bat файлами чтобы можно было запустить без установки ноды – тоже повозились прилично, раза три-четыре переделывали. То кириллица в батниках не работает, то скрипты папку .git не находят, то портабельную ноду неправильно детектят.

Работы еще много – нужно пофиксить баги, улучшить UX, добавить фич. Если вы тоже генерируете видео и хотите помочь с разработкой – буду рад, проект открытый.

Рекомендации

Вот список полезных рекомендаций из моего опыта. Кстати они скорее всего подойдут и для других код агентов тоже, не только для девина [12].

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом - 8

Первое и самое важное – формулируйте задачи максимально конкретно. Не “добавь экспорт аудио”, а “добавь кнопку экспорта аудио используя FFmpeg.wasm, посмотри как сделан экспорт видео в файле VideoExport.tsx”. Чем больше контекста и ссылок на существующий код – тем лучше результат. Да девин умеет искать в кодовой базе, но лучше сразу направить его куда надо.

Второе – не бойтесь остановить его если видите что поехал не туда. Лучше остановить на старте чем ждать когда он накосячит на пару ACU вперед. Я обычно пишу “стоп, откатываем, пробуем иначе” – и девин сам откатывает изменения и пробует другой подход. Это реально экономит кучу времени и денег.

Третье – следите за размером диалога. Когда ACU приближается к 5 – лучше завершить сессию и начать новую. Девин сам подскажет и составит инструкцию для следующей сессии, просто копируете и вставляете. Работа станет намного эффективнее, проверено.

Четвертое – готовьте базу контекста заранее. Приложите ссылки на документацию, а лучше сразу саму документацию в формате markdown. Конечно девин и сам все найдет и везде залезит, но это ваше время и деньги. Вам кликнуть куда быстрее и проще чем ему искать.

Еще по опыту – девин хорошо справляется с рефакторингом, миграциями, исправлением багов. Мелкие правки в UI, интеграции новых моделей – вообще без проблем. А вот с комплексными фичами типа того же экспорта аудио может быть геморой – придется несколько раз переделывать пока не заработает как надо.

И самое главное – вы не пассивный наблюдатель, а активный ревьюер кода. Отслеживайте его действия, читаете его планы, вмешиваетесь когда нужно. Иногда берете управление на себя чтобы показать как надо, потом возвращаете ему. Это как работать с джуном – нужен контроль, но не микроменеджмент.

А что в итоге остался ли я доволен этим экспериментом?

И да и нет.

С одной стороны первый аи агент который реально справляется с задачами хоть и не идеально. Доступен круглосуточно когда идея приспичит. Рефанд за косяки реально снимает негатив от неудач.

С другой стороны наверно дешевле было бы нанять обычного разработчика. Только вот разработчику нужно подробное ТЗ заранее, а с аи можно просто итерировать и экспериментировать на ходу добавляя что нужно.

А VideoSOS все еще далек от завершения, если вы генерируете видео – приглашаю контрибьютить: https://github.com/timoncool/videosos [3] И конечно поддержите проект на Стартап Радаре [5].

Я рассказываю больше о нейросетях у себя на YouTube [2], в Телеграм [16] и на Бусти [17]. Всех обнял и удачных экспериментов.

Автор: timonin

Источник [18]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/20685

URLs in this post:

[1] ArtGeneration.me: http://ArtGeneration.me

[2] техноблогер: https://www.youtube.com/@nerual_dreming

[3] https://github.com/timoncool/videosos: https://github.com/timoncool/videosos

[4] https://videosos.vercel.app/: https://videosos.vercel.app/

[5] https://productradar.ru/product/videosos-ai-redaktor/: https://productradar.ru/product/videosos-ai-redaktor/

[6] TikTok: https://www.tiktok.com/@satisfactorylabs

[7] YouTube: https://www.youtube.com/@Satisfactorylabs

[8] самоубийством: http://www.braintools.ru/article/8864

[9] https://github.com/fal-ai-community/video-starter-kit: https://github.com/fal-ai-community/video-starter-kit

[10] опыт: http://www.braintools.ru/article/6952

[11] Ohara.ai: http://Ohara.ai

[12] Devin: https://app.devin.ai/invite/fdc44857a73c4afea4c0763e67c7a2d2

[13] ошибку: http://www.braintools.ru/article/4192

[14] Runware.ai: http://Runware.ai

[15] portable Windows версию: https://github.com/timoncool/videosos/releases/tag/v1.0.0-portable

[16] Телеграм: https://t.me/nerual_dreming

[17] Бусти: https://boosty.to/neuro_art

[18] Источник: https://habr.com/ru/articles/956622/?utm_source=habrahabr&utm_medium=rss&utm_campaign=956622

www.BrainTools.ru

Rambler's Top100