voicemail.

Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых

Каждый из нас хоть раз получал голосовое сообщение на 5 минут, которое проще было бы прочитать за 30 секунд. А если таких сообщений - целая папка? Я написал open-source инструмент voice-to-text, который умеет массово расшифровывать голосовые из Telegram, WhatsApp и других мессенджеров. В статье расскажу про архитектуру, подводные камни Whisper и сравнение четырех бэкендов транскрипции.Зачем это нужноУ проекта было три причины:1. Практическая потребность.

продолжить чтение

Rambler's Top100