- BrainTools - https://www.braintools.ru -

xAI открывает Grok Voice Agent API с задержкой ответа менее секунды

xAI открывает Grok Voice Agent API с задержкой ответа менее секунды - 1

Компания Илона Маска xAI представила Grok Voice Agent API, новый инструмент для создания голосовых ассистентов с поддержкой speech-to-speech. API построен на полностью собственной архитектуре и обеспечивает задержку ответа менее 1 секунды, что позволяет создавать максимально отзывчивые голосовые интерфейсы. Это делает решение пригодным для широкого спектра задач, от интерактивных помощников до интеграции в корпоративные системы.

Одной из ключевых особенностей Grok Voice Agent API стала возможность взаимодействовать с внешними инструментами, выполнять веб-поиск и интегрироваться с телефонией через SIP. Модель поддерживает более 100 языков, что открывает использование в глобальном масштабе. В бенчмарке Big Bench Audio Grok продемонстрировал точность 92,3%, заняв первое место и обойдя конкурентов вроде Gemini 2.5 Flash и GPT Realtime. Такой результат подтверждает высокое качество распознавания и генерации речи, а также способность модели к сложной обработке аудиоданных.

xAI открывает Grok Voice Agent API с задержкой ответа менее секунды - 2

Главной особенностью нового API стала ценовая политика: единый тариф составляет $0,05 за минуту использования, что значительно дешевле аналогичных сервисов от OpenAI и ElevenLabs. Это делает Grok Voice Agent привлекательным для компаний и разработчиков, которые хотят внедрять голосовые интерфейсы в массовые приложения, не увеличивая операционные расходы.

xAI открывает Grok Voice Agent API с задержкой ответа менее секунды - 3

API позволяет создавать персонализированные голосовые ассистенты, которые понимают контекст и могут поддерживать связный диалог, а также использовать сторонние инструменты и интеграции для автоматизации действий. xAI планирует активно развивать экосистему Grok, расширяя количество доступных функций и языков, а также поддерживать разработчиков через документацию и SDK.

С запуском Grok Voice Agent API xAI демонстрирует, что голосовые интерфейсы становятся более быстрыми, точными и доступными, а рынок speech-to-speech решений готов к массовому внедрению в приложениях, продуктах и корпоративных системах. Технология обещает ускорить разработку умных ассистентов и сделать их использование более экономичным и гибким для разработчиков.


Делегируйте часть рутинных задач вместе с BotHub! [1] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [2] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник [3]

Автор: cognitronn

Источник [4]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/23420

URLs in this post:

[1] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=DEEPSEEK-OCR%20+%20LLAMA4%20+%20RAG%20=%20REVOLUTION%20IN%20THE%20WORLD%20OF%20AGENT-BASED%20OCR

[2] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[3] Источник: https://x.ai/news/grok-voice-agent-api?utm_source=tldrai

[4] Источник: https://habr.com/ru/companies/bothub/news/978370/?utm_source=habrahabr&utm_medium=rss&utm_campaign=978370

www.BrainTools.ru

Rambler's Top100