«Т‑банк» тестирует голосовые переводы между клиентами
«Т‑банк» тестирует возможность переводить деньги между физлицами с помощью голосового ассистента. Функция пока проходит испытания на закрытой группе пользователей,
Anthropic внедрила голосовой режим в Claude Code
Anthropic внедрила голосовой режим в помощника на базе искусственного интеллекта для разработчиков Claude Code. В настоящий момент новый режим доступен примерно 5% пользователей, а более широкое развёртывание состоится в ближайшие недели, рассказал инженер компании Тарик Шихипар.
Apple попросила Google адаптировать серверы для новой Siri на базе Gemini
Apple попросила Google изучить возможность «настройки серверов» для обновления голосового помощника Siri на базе моделей искусственного интеллекта Gemini, которое будет соответствовать стандартам конфиденциальности производителя iPhone, пишет Information.
Разрабатываем голосового ассистента на Rockchip. Часть 2
Продолжаю разрабатывать DIY голосового ассистента на SOC-платформе Rockchip.В первой части мы соединили в единый конвейер вызов распознавания речи, локального чат-бота и синтез ответа.Если еще не читали, то вам
Пользователи Google TV столкнулись с проблемой после внедрения голосового помощника Gemini
Пользователи Google TV пожаловались, что внедрение голосового помощника на базе искусственного интеллекта Gemini привело сбою во время поиска. Одним из вариантов исправления сбоя стало удаление последнего обновления Google TV.
Samsung запустила бета-версию ИИ-помощника Bixby, позволяющую управлять смартфоном с помощью естественного языка
Samsung запустила бета-версию обновлённого голосового помощника Bixby. Южнокорейская компания пытается превратить Bixby в агента искусственного интеллекта, интегрированного в оболочку One UI 8.5. Производитель позволит управлять смартфоном через Bixby на естественном языке, а не при помощи технических команд.
Nvidia выпустила открытую модель PersonaPlex — голосовой ИИ, который одновременно слушает и говорит
Традиционные голосовые помощники последовательно запускают распознавание речи, языковые модели и синтез речи. Это позволяет настраивать голос и роль, но приводит к роботизированным разговорам с неестественными паузами. Более новые системы, такие как Moshi от французской лаборатории искусственного интеллекта Kyutai, делают разговоры более естественными, но привязывают пользователей к одному фиксированному голосу и роли.
ИИ в логистике и складской автоматизации: глобальные тренды и российская реальность
Почему умные склады в РФ — это пока редкость?Привет, Хабр!Мы в INTEKEY

