- BrainTools - https://www.braintools.ru -

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.
Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.
Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.
Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.
Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:
Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.
Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.
Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.
Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».
Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.
Мультиязычный интерфейс. Доступны русский и английский.
Автообновления и интеграция с GitHub.
Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.
Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.
Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.
В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».
Плавно спускаемся ниже.

Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.
Для каждого говорящего доступна отдельная панель настроек. Здесь можно:
Указать имя говорящего, которое должно совпадать с именем в тексте диалога.
Выбрать референсный голос из доступных вариантов.
Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.
Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D
В самом низу находятся расширенные настройки:

Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:

В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.
Начнём с простого — рассуждения Винни-Пуха.
Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.
Сгенерируем диалог с тремя участниками – Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.
Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.
Дмитрий Нагиев и Чебурашка:
Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper [3], скачать её можно на GitHub [3]. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.
Ещё пара примеров:
Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.
Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут [5].
Новости, обзоры продуктов и конкурсы от команды [6]Timeweb.Cloud [7] — в нашем Telegram-канале [6] ↩
Перед оплатой в разделе «Бонусы и промокоды» в панели управления активируйте промокод и получите кэшбэк на баланс

Подписывайтесь на 👾Нейро-Софт [9], канал с портативными версиями ваших любимых нейросетей!
Автор: Wonderlove
Источник [17]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12936
URLs in this post:
[1] vkvideo.ru: https://vkvideo.ru/video633812481_456239047
[2] vkvideo.ru: https://vkvideo.ru/video633812481_456239049
[3] крутую нейронку Whisper: https://github.com/Const-me/Whisper
[4] vkvideo.ru: https://vkvideo.ru/video633812481_456239045
[5] тут: https://t.me/neuroport/70
[6] Новости, обзоры продуктов и конкурсы от команды : https://t.me/timewebru
[7] Timeweb.Cloud: http://Timeweb.Cloud
[8] Опробовать: https://timeweb.cloud/
[9] 👾Нейро-Софт: https://t.me/neuroport
[10] : https://habr.com/ru/companies/timeweb/articles/845410/
[11] Обновление FaceFusion v3.0.0 — ультимативной нейросети для дипфейков: https://habr.com/ru/companies/timeweb/articles/851398/
[12] AI персона — инструкция по формированию разума: https://habr.com/ru/companies/timeweb/articles/885626/
[13] Симуляция миров: как работает нейросеть SORA: https://habr.com/ru/companies/timeweb/articles/797999/
[14] Создание музыки в нейросети Udio, подробная инструкция с примерами от сообщества: https://habr.com/ru/companies/timeweb/articles/811167/
[15] : https://habr.com/ru/companies/timeweb/articles/884082/
[16] Нейросеть мне в помощь или как я сделал телеграм бота, который умеет переводить песни: https://habr.com/ru/companies/timeweb/articles/774806/
[17] Источник: https://habr.com/ru/companies/timeweb/articles/888268/?utm_campaign=888268&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.