Как я вайбкодил озвучку текста для AutoCraft
Немного предысторииС этим расширением всё началось довольно просто: я хотел упростить себе озвучку книг и больших текстов внутри своего проекта, а не прыгать каждый раз между разными сервисами и программами.План был обычный: вставил текст, выбрал движок, получил озвучку.Но потом, как это часто бывает, всё поехало чуть дальше:LLM подкинула несколько идейкто-то попросил добавить дополнительные возможностиа мне самому пришлось разбираться с символами, которые вообще не должны озвучиватьсяВ итоге из обычной функции озвучки выросло отдельное расширение для веб-панели AutoCraft.
Qwen3-TTS: синтезируем голос на любом устройстве
Привет, Хабр!Несколько дней назад Alibaba выпустила в открытый доступ линейку своих моделей для генерации аудио. На рынке не так часто случаются такие выпуски, поэтому я решил проверить ее возможности и написать свой отзывО моделях
Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия
Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.
Наш синтез для 20 языков теперь работает локально под Windows как экранная читалка (SAPI5) и в Балаболке
Всё шло к этому. Мы решили
Мы опубликовали стабильный, быстрый, качественный и доступный синтез для 20 языков России
Дружба народов здорового человекаНаконец-то представляем наш синтез для языков России и СНГ. В этот раз получилось покрыть 20 языков, всего 95 голосов. От старой демки этот релиз отличается следующим:
Мы добавили поддержку ещё 19 языков России и СНГ в проект silero-stress
Новости, о которых невозможно молчатьМы недавно писали на Хабр о нашей библиотеке silero-stress для простановки ударения в обычных словах и омографах. Теперь у нашего проекта
Наш новый LLM-based синтез речи
Всем привет! Я Гриша Стерлинг, лид команды TTS в Сбере. Мы сделали новый синтез речи, он на голову лучше старого, особенно по естественности и человечности. Мы так и называем его – «новый синтез», или GigaTTS. Он умеет смеяться, справляется со всеми эмоциями, говорит как живой человек.Сразу предлагаю поболтать с ним в голосовом режиме GigaChat.
Мы опубликовали silero-tts v5 на русском языке
Пора!Время пришло. Мы решили задачу омографов (пока в первой версии, но идей ещё вагон) и теперь удовольствие от публикации наших новых публичных моделей синтеза наконец-то будет полным! Более того, что следом за ними пойдут ещё кое-какие модели, но это будет сюрприз.Что поменялось:
Мы решили задачу омографов и ударений в русском языке
Мы наконец решили задачу омографов. Конечно, с рядом оговорок, куда без них. Получилось пресловутое приключение на 20 минут.

