Озвучка диалогов с помощью нейросети FishSpeech

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.

Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.

Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.

❯ Основные особенности FishSpeech🐠

Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.

Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:

Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.
Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.
Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.
Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».
Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.
Мультиязычный интерфейс. Доступны русский и английский.
Автообновления и интеграция с GitHub.

❯ Обзор интерфейса

Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.

Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.

Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.

В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».

Плавно спускаемся ниже.

Озвучка диалогов с помощью нейросети FishSpeech - 3

Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.

Для каждого говорящего доступна отдельная панель настроек. Здесь можно:

Указать имя говорящего, которое должно совпадать с именем в тексте диалога.
Выбрать референсный голос из доступных вариантов.
Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.

Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D

В самом низу находятся расширенные настройки:

Озвучка диалогов с помощью нейросети FishSpeech - 4

Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:

Озвучка диалогов с помощью нейросети FishSpeech - 5

В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.

❯ Примеры и возможности

Начнём с простого — рассуждения Винни-Пуха.

ВинниПух

vkvideo.ru ^[1]

Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.

Сгенерируем диалог с тремя участниками – Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.

Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.

МатроскинENG

vkvideo.ru ^[2]

Дмитрий Нагиев и Чебурашка:

Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper ^[3], скачать её можно на GitHub ^[3]. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.

Ещё пара примеров:

Диалог 5

vkvideo.ru ^[4]

Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.

Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут ^[5].

Новости, обзоры продуктов и конкурсы от команды ^[6]Timeweb.Cloud ^[7] — в нашем Telegram-канале ^[6] ↩

Перед оплатой в разделе «Бонусы и промокоды» в панели управления активируйте промокод и получите кэшбэк на баланс

Озвучка диалогов с помощью нейросети FishSpeech - 7

Подписывайтесь на 👾Нейро-Софт ^[9], канал с портативными версиями ваших любимых нейросетей!

📚 Читайте также:

Автор: Wonderlove

Источник ^[17]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/12936

URLs in this post:

[1] vkvideo.ru: https://vkvideo.ru/video633812481_456239047

[2] vkvideo.ru: https://vkvideo.ru/video633812481_456239049

[3] крутую нейронку Whisper: https://github.com/Const-me/Whisper

[4] vkvideo.ru: https://vkvideo.ru/video633812481_456239045

[5] тут: https://t.me/neuroport/70

[6] Новости, обзоры продуктов и конкурсы от команды : https://t.me/timewebru

[7] Timeweb.Cloud: http://Timeweb.Cloud

[8] Опробовать: https://timeweb.cloud/

[9] 👾Нейро-Софт: https://t.me/neuroport

[10] : https://habr.com/ru/companies/timeweb/articles/845410/

[11] Обновление FaceFusion v3.0.0 — ультимативной нейросети для дипфейков: https://habr.com/ru/companies/timeweb/articles/851398/

[12] AI персона — инструкция по формированию разума: https://habr.com/ru/companies/timeweb/articles/885626/

[13] Симуляция миров: как работает нейросеть SORA: https://habr.com/ru/companies/timeweb/articles/797999/

[14] Создание музыки в нейросети Udio, подробная инструкция с примерами от сообщества: https://habr.com/ru/companies/timeweb/articles/811167/

[15] : https://habr.com/ru/companies/timeweb/articles/884082/

[16] Нейросеть мне в помощь или как я сделал телеграм бота, который умеет переводить песни: https://habr.com/ru/companies/timeweb/articles/774806/

[17] Источник: https://habr.com/ru/companies/timeweb/articles/888268/?utm_campaign=888268&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.