аудиокнига.

Посимвольная нейросетевая модель для автоматической акцентуации русского языка

Привет Хабр, решил поделиться небольшой моделью для расстановки ударений, которую обучил на датасете, из более 400 книг художественной прозы с лицензией MIT. О чём речьРазрабатывая систему синтеза речи на базе Silero TTS, столкнулся с проблемой: минимальные ошибки в расстановке ударений всего два процента из 100 приводят к ошибкам в каждом из 5-6 предложений. Для аудиокниг это критично, так процесс "выслушивания" и правки книги на 10000 предожений потребует не менее 10 часов ручного времени.Сделал свою модель с фокусом на точность в хужожественных книгах. Получилось 99.7% на валидационном датасете. Упаковал в pip-пакет

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

аудиокнига.

Посимвольная нейросетевая модель для автоматической акцентуации русского языка

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

аудиокнига.

Посимвольная нейросетевая модель для автоматической акцентуации русского языка