речь.

Hume AI открыла быстрый генератор речи TADA

Компания Hume AI открыла исходный код TADA - системы искусственного интеллекта для генерации речи, которая синхронно обрабатывает текст и аудио. 

продолжить чтение

Как нейробиолог разрушила главный миф о связи речи с интеллектом и причем тут вообще LLM

Долгое время считалось, что язык — это фундамент человеческого разума, ключ к математике, музыке и сложному социальному познанию. 

продолжить чтение

Google добавил генерацию речи в Gemini API

продолжить чтение

Исследование: люди всё чаще говорят на диалекте, навеянном чат-ботами

Чем больше люди взаимодействуют с искусственным интеллектом, тем больше он влияет

продолжить чтение

Harmony бьет конкурентов: Новый фреймворк генерирует идеально синхронное видео и звук

Исследователи из Shanghai Jiao Tong University и Tencent Hunyuan представили Harmony - фреймворк для генерации синхронизированного аудиовизуального контента.

продолжить чтение

ИИ внедряется в наш язык: люди стали копировать слова ChatGPT

Учёные из Университета штата Флорида пришли к выводу, что искусственный интеллект начал напрямую влиять на то, как разговаривают люди. В рамках исследования

продолжить чтение

Microsoft выпустила VibeVoice — открытую TTS-модель для генерации диалогов и подкастов продолжительностью до 90 минут

Исследователи Microsoft Research представили VibeVoice — модель для генерации диалогов из текста. Главная особенность TTS-системы в том, что она может создавать диалоги продолжительностью до 90 минут с четырьмя действующими лицами.

продолжить чтение

Синтез речи ◍ 2025: топ-4 бесплатных нейросетей для озвучки текста

Искусственный интеллект давно перестал быть набором скучных алгоритмов. Это и художник, который рисует словами, и переводчик, что ломает языковые барьеры, и музыкант, играющий на голосовых нотах. Но есть у него ещё одно дело, в котором он преуспел, — синтез речи.

продолжить чтение

Внутренний голос: как электроды и ИИ возвращают речь парализованным людям

Представьте ситуацию: вы составляете фразу в своей голове, но произносит ее компьютерный помощник, а не вы. Для миллионов людей, которые лишены речи из-за паралича, инсульта или нейродегенеративных заболеваний, это становится реальностью. Импланты, сверхтонкие электроды и искусственный интеллект позволяют преобразовать электрическую активность мозга в слова. От калифорнийских лабораторий до российских стартапов — ученые и компании учатся возвращать голос тем, кто молчал годами. Сегодня предлагаю разобраться, как это работает и какие проекты меняют жизни уже сейчас.

продолжить чтение

ElevenLabs представил автономную модель преобразования речи в текст Scribe

ElevenLabs, стартап в сфере искусственного интеллекта, который только что получил 180 миллионов долларов в рамках мегафинансирования, в первую очередь известен своим мастерством в создании аудио. Компания сделала шаг в другом технологическом направлении, выпустив свою первую автономную модель преобразования речи в текст под названием Scribe.

продолжить чтение

12
Rambler's Top100