синтез речи.

Наш новый LLM-based синтез речи

Всем привет! Я Гриша Стерлинг, лид команды TTS в Сбере. Мы сделали новый синтез речи, он на голову лучше старого, особенно по естественности и человечности. Мы так и называем его – «новый синтез», или GigaTTS. Он умеет смеяться, справляется со всеми эмоциями, говорит как живой человек.Сразу предлагаю поболтать с ним в голосовом режиме GigaChat.

продолжить чтение

Оставлено в

Мы опубликовали silero-tts v5 на русском языке

Пора!Время пришло. Мы решили задачу омографов (пока в первой версии, но идей ещё вагон) и теперь удовольствие от публикации наших новых публичных моделей синтеза наконец-то будет полным! Более того, что следом за ними пойдут ещё кое-какие модели, но это будет сюрприз.Что поменялось:

продолжить чтение

Оставлено в

Мы решили задачу омографов и ударений в русском языке

Мы наконец решили задачу омографов. Конечно, с рядом оговорок, куда без них. Получилось пресловутое приключение на 20 минут.

продолжить чтение

Оставлено в

Вышла новая открытая модель синтеза речи Kani-TTS-370M

продолжить чтение

Оставлено в

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.Что это такое и зачем нужно

продолжить чтение

Оставлено в

Hume AI выпустил быструю модель для синтеза речи

продолжить чтение

Оставлено в

Qwen запустила Qwen3-TTS-Flash: ИИ-голос в реальном времени

Китайская компания Qwen представила модель Qwen3-TTS-Flash

продолжить чтение

Оставлено в

Генерация звуков по тексту: ElevenLabs представила v2 модели SFX

Сервис ElevenLabs представил вторую версию своей модели для генерации звуковых эффектов. В обновлении улучшено качество аудио, частота дискретизации выросла до 48 кГц, а максимальная длина клипа увеличена с 22 до 30 секунд.

продолжить чтение

Оставлено в

Realtime API вышел из беты: OpenAI представила gpt-realtime и снизила цены на 20%

OpenAI сделала важный шаг для рынка голосовых интерфейсов: Realtime API официально вышел из бета-версии и теперь доступен всем разработчикам. Вместе с этим компания представила модель gpt-realtime

продолжить чтение

Оставлено в

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

Примерно год назад мы запустили

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

синтез речи.

Наш новый LLM-based синтез речи

Мы опубликовали silero-tts v5 на русском языке

Мы решили задачу омографов и ударений в русском языке

Вышла новая открытая модель синтеза речи Kani-TTS-370M

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

Hume AI выпустил быструю модель для синтеза речи

Qwen запустила Qwen3-TTS-Flash: ИИ-голос в реальном времени

Генерация звуков по тексту: ElevenLabs представила v2 модели SFX

Realtime API вышел из беты: OpenAI представила gpt-realtime и снизила цены на 20%

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

синтез речи.