Звук. - страница 5

ElevenLabs запустила аудиоредактор для видеороликов

Компания ElevenLabs представила обновление своей платформы — Studio 3.0

продолжить чтение

Как мы разрабатывали интеллектуальное устройство SberBoom Micro

Салют, Хабр!

продолжить чтение

Функция Windows Studio Effects стала доступна для внешних камер

ИИ-функция Windows Studio Effects для улучшения видео и звука во время звонков и записей в Windows 11 доступна для встроенных веб-камер на компьютерах с Copilot+ и процессорами Qualcomm, Intel и AMD. Теперь Windows Studio Effects

продолжить чтение

В Microsoft Teams появилась возможность прослушивать сводки собраний

Компания Microsoft начала внедрять

продолжить чтение

В Великобритании создатель ИИ-музыки подписал контракт с музыкальным лейблом

Британский создатель музыки с помощью искусственного интеллекта Оливер Маккэнн подписал контракт с независимым лейблом Hallwood Media. Один из треков Маккэнна набрал 3 млн прослушиваний. Это первый случай, когда лейбл заключил контракт с музыкантом, полностью создающим песни нейросетями.Маккэнн не имеет музыкального образования и использует ИИ‑инструменты (вроде Suno и Udio) для создания песен. Другим примером популярности ИИ‑музыки выступает группа Velvet Sundown, все песни и обложки которой созданы нейросетями.

продолжить чтение

Plaud анонсировала новый умный диктофон Note Pro

Компания Plaud анонсировала обновлённую версию своего умного диктофона размером с кредитную карту — Plaud Note Pro, пишет The Verge.

продолжить чтение

Microsoft выпустила VibeVoice — открытую TTS-модель для генерации диалогов и подкастов продолжительностью до 90 минут

Исследователи Microsoft Research представили VibeVoice — модель для генерации диалогов из текста. Главная особенность TTS-системы в том, что она может создавать диалоги продолжительностью до 90 минут с четырьмя действующими лицами.

продолжить чтение

Исследователи представили технологию прослушки смартфонов с помощью радаров автопилотов

Исследователи из Университета штата Пенсильвания обнаружили, что вибрации динамика внутри телефона при разговоре можно уловить радарным датчиком автопилота автомобиля. Они смогли преобразовать эти вибрации в аудио и расшифровать их с помощью искусственного интеллекта.

продолжить чтение

Google выпустила биоакустическую модель Perch 2.0 для наблюдения за звуками животного мира

Исследователи Google Deepmind выпустили обновление Perch 2.0, предназначенной для акустического наблюдения звуками диких животных. Если первая версия была обучена только для распознавания звуков птиц, то в обновлении идею расширили до звуков птиц, млекопитающих, амфибий, а также антропогенных и общих звуков дикого мира.

продолжить чтение

«Яндекс Книги» обновили виртуального ИИ‑рассказчика

«Яндекс Книги» запустили новую версию виртуального рассказчика с улучшенной нейросетевой моделью синтеза голоса. Функция доступна для 120 тысяч произведений. По словам «Яндекса», интонации рассказчика стали более живыми и естественными. Манера чтения меняется в зависимости от жанра книги. В работе использовалась новая ИИ‑модель, демонстрирующая высокое качество синтеза на русском языке. В «Яндекс Книгах» утверждают, что качество ИИ‑модели в 80% случаев лучше, чем у ElevenLabs.

продолжить чтение

1...345678...10
Rambler's Top100