WhisperX.

Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков

У многих из нас есть «кладбище» аудиозаписей: интервью, лекции, длинные совещания. Когда мой архив перевалил за сотню часов, я понял, что пора что-то менять. Облачные сервисы либо кусаются по цене, либо выдают «кашу» без нормальной пунктуации и разделения спикеров.В этой статье я расскажу, как собрал локальный конвейер на базе WhisperX, почему 40 ГБ оперативной памяти важнее мощной видеокарты и как метод «вайб-кодинга» помог мне превратить одиночный скрипт в модульное приложение с пакетной обработкой.Почему не ванильный Whisper?Оригинальный Whisper от OpenAI хорош, но для моих задач у него было три фатальных недостатка:

продолжить чтение

Rambler's Top100