Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса
Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.
Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом
TLDR: я написал BrainBox — local-first сервис поддержки open-source ИИ-систем для генерации изображений, распознавания объектов на снимках, озвучки, распознавания текстов, транскрибирования аудиозаписей и других целей. Эти системы запускаются за фасадом веб-сервера, который устанавливает их и затем принимает и выполняет задачи в едином для всех систем формате. Задачи можно ставить из любого языка программирования с помощью отправки веб-запросов на сервер, а для Python дополнительно разработан удобный API. Проект доступен на pypi https://pypi.org/project/kaia-brainbox/
OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ
Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.
Сообщается, что Anthropic готовит голосовой режим для Claude
Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.
Будущее v-commerce: как использовать распознавание речи и голосовой поиск в 2025 году
Шопинг с использованием голоса уже не кажется чем-то удивительным. По данным опроса Департамента социальных исследований и консалтинга ВЦИОМ Андрей Даудрих, среди 63% россиян, которые использовали ИИ-инструменты в. 2024 году, 31% прибегали преимущественно к голосовым помощникам.
Записи автоответчиков стали использовать для создания дипфейков
Мошенники могут использовать персональные голосовые приветствия на автоответчиках для создания дипфейков — об этом предупредили эксперты. Эти записи позволяют злоумышленникам при помощи нейросетей имитировать голос потенциальной жертвы и в дальнейшем использовать его при атаках на её окружение, пишут «Известия».
Microsoft представила голосовой ИИ Dragon Copilot для врачей
Microsoft анонсировала Dragon Copilot, нового помощника на основе искусственного интеллекта, который объединяет возможности Dragon Medical One (DMO) и DAX Copilot (DAX). Он предназначается для оптимизации работы врачей.
Xiaomi внедрит в своего голосового ассистента поддержку DeepSeek-R1
Xiaomi тестирует совместимость голосового ассистента Xiao AI с нейросетевой моделью DeepSeek-R1. Компания работает над расширением возможностей ИИ внутри своей экосистемы HyperOS.
Amazon и Apple испытывают трудности с внедрением ИИ в цифровые помощники
Amazon и Apple испытывают трудности с внедрением технологий генеративного искусственного интеллекта в цифровые помощники — Alexa и Siri. Об этом в своих отчётах сообщили Washington Post и Bloomberg.

