OpenAI выпустила модель gpt-realtime-1.5 для Realtime API, повысив надежность голосовых команд: точность транскрипции цифр и букв выросла на 10%, логические аудиозадачи — на 5%, инструкции — на 7%. Аудиомодель обновлена до версии 1.5. Responses API теперь использует WebSocket, ускоряя ИИ-агентов с tool calls на 20–40%.

OpenAI подготовила два обновления API специально для разработчиков: модель gpt-realtime-1.5 предназначена для Realtime API и помогает добиться большей надежности при обработке голосовых команд.
В ходе внутренних проверок компания зафиксировала прибавку в точности распознавания цифр и букв примерно на 10%, рост эффективности в логических задачах с аудио на 5% и улучшение выполнения инструкций на 7%. Аудиомодель также перешла на версию 1.5.
Responses API обзавелась поддержкой WebSocket. Теперь нет нужды каждый раз отправлять полный контекст заново — открывается устойчивое соединение, которое передает только поступающие обновления.
По данным OpenAI, такие изменения позволяют ускорить функционирование сложных ИИ-агентов с множеством обращений к инструментам на 20–40%.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.
Автор: mefdayy


