Голосовые интерфейсы. - страница 5

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.

продолжить чтение

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

TLDR: я написал BrainBox — local-first сервис поддержки open-source ИИ-систем для генерации изображений, распознавания объектов на снимках, озвучки, распознавания текстов, транскрибирования аудиозаписей и других целей. Эти системы запускаются за фасадом веб-сервера, который устанавливает их и затем принимает и выполняет задачи в едином для всех систем формате. Задачи можно ставить из любого языка программирования с помощью отправки веб-запросов на сервер, а для Python дополнительно разработан удобный API. Проект доступен на pypi https://pypi.org/project/kaia-brainbox/

продолжить чтение

OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ

Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.

продолжить чтение

Сообщается, что Anthropic готовит голосовой режим для Claude

Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.

продолжить чтение

Будущее v-commerce: как использовать распознавание речи и голосовой поиск в 2025 году

Шопинг с использованием голоса уже не кажется чем-то удивительным. По данным опроса Департамента социальных исследований и консалтинга ВЦИОМ Андрей Даудрих, среди 63% россиян, которые использовали ИИ-инструменты в. 2024 году, 31% прибегали преимущественно к голосовым помощникам.

продолжить чтение

Записи автоответчиков стали использовать для создания дипфейков

Мошенники могут использовать персональные голосовые приветствия на автоответчиках для создания дипфейков — об этом предупредили эксперты. Эти записи позволяют злоумышленникам при помощи нейросетей имитировать голос потенциальной жертвы и в дальнейшем использовать его при атаках на её окружение, пишут «Известия».

продолжить чтение

Следующие модели Llama от Meta* могут получить улучшенные голосовые функции

Мировой гигант социальных сетей внедряет усовершенствованные функции, делая ставку на технологии, которые, как ожидается, станут двигателем роста ИИ-агентов.

продолжить чтение

Microsoft представила голосовой ИИ Dragon Copilot для врачей

Microsoft анонсировала Dragon Copilot, нового помощника на основе искусственного интеллекта, который объединяет возможности Dragon Medical One (DMO) и DAX Copilot (DAX). Он предназначается для оптимизации работы врачей.

продолжить чтение

Xiaomi внедрит в своего голосового ассистента поддержку DeepSeek-R1

Xiaomi тестирует совместимость голосового ассистента Xiao AI с нейросетевой моделью DeepSeek-R1. Компания работает над расширением возможностей ИИ внутри своей экосистемы HyperOS. 

продолжить чтение

Amazon и Apple испытывают трудности с внедрением ИИ в цифровые помощники

Amazon и Apple испытывают трудности с внедрением технологий генеративного искусственного интеллекта в цифровые помощники — Alexa и Siri. Об этом в своих отчётах сообщили Washington Post и Bloomberg.

продолжить чтение

Rambler's Top100