
Компания Илона Маска xAI представила Grok Voice Agent API, новый инструмент для создания голосовых ассистентов с поддержкой speech-to-speech. API построен на полностью собственной архитектуре и обеспечивает задержку ответа менее 1 секунды, что позволяет создавать максимально отзывчивые голосовые интерфейсы. Это делает решение пригодным для широкого спектра задач, от интерактивных помощников до интеграции в корпоративные системы.
Одной из ключевых особенностей Grok Voice Agent API стала возможность взаимодействовать с внешними инструментами, выполнять веб-поиск и интегрироваться с телефонией через SIP. Модель поддерживает более 100 языков, что открывает использование в глобальном масштабе. В бенчмарке Big Bench Audio Grok продемонстрировал точность 92,3%, заняв первое место и обойдя конкурентов вроде Gemini 2.5 Flash и GPT Realtime. Такой результат подтверждает высокое качество распознавания и генерации речи, а также способность модели к сложной обработке аудиоданных.

Главной особенностью нового API стала ценовая политика: единый тариф составляет $0,05 за минуту использования, что значительно дешевле аналогичных сервисов от OpenAI и ElevenLabs. Это делает Grok Voice Agent привлекательным для компаний и разработчиков, которые хотят внедрять голосовые интерфейсы в массовые приложения, не увеличивая операционные расходы.

API позволяет создавать персонализированные голосовые ассистенты, которые понимают контекст и могут поддерживать связный диалог, а также использовать сторонние инструменты и интеграции для автоматизации действий. xAI планирует активно развивать экосистему Grok, расширяя количество доступных функций и языков, а также поддерживать разработчиков через документацию и SDK.
С запуском Grok Voice Agent API xAI демонстрирует, что голосовые интерфейсы становятся более быстрыми, точными и доступными, а рынок speech-to-speech решений готов к массовому внедрению в приложениях, продуктах и корпоративных системах. Технология обещает ускорить разработку умных ассистентов и сделать их использование более экономичным и гибким для разработчиков.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


