Gemini Live.

Nvidia выпустила открытую модель PersonaPlex — голосовой ИИ, который одновременно слушает и говорит

Традиционные голосовые помощники последовательно запускают распознавание речи, языковые модели и синтез речи. Это позволяет настраивать голос и роль, но приводит к роботизированным разговорам с неестественными паузами. Более новые системы, такие как Moshi от французской лаборатории искусственного интеллекта Kyutai, делают разговоры более естественными, но привязывают пользователей к одному фиксированному голосу и роли.

продолжить чтение

Google внедряет новые функции в Gemini Live: ИИ сможет «видеть» экран и камеру смартфона

Компания Google начала внедрять в Gemini Live новые функции ИИ, которые позволяют ей «видеть» ваш экран или камеру вашего смартфона и отвечать на вопросы в режиме реального времени, подтвердил представитель Google Алекс Джозеф в электронном письме The Verge. Эти функции появились почти через год после того, как Google впервые продемонстрировала работу «Project Astra», на которой они основаны.

продолжить чтение

Rambler's Top100