
OpenAI усиливает инвестиции в аудио-ИИ, оформляя это не просто как улучшение голосовых функций ChatGPT, а как стратегический поворот к интерфейсам будущего, где экран перестаёт быть главным способом взаимодействия с технологиями. Компания объединила несколько инженерных, продуктовых и исследовательских команд для работы над новым аудио-стеком в преддверии запуска персонального аудио-устройства примерно через год.
Это отражает более широкую тенденцию в индустрии: голос и звук всё больше выходят на первый план. Уже сейчас в более чем трети американских домов есть умные колонки с голосовыми ассистентами, а крупные технологические компании экспериментируют с разными формами аудио-интерфейсов. Meta* интегрировала массив из пяти микрофонов в свои Ray-Ban smart glasses для направленного усиления звука, Google тестирует аудиоподсказки, превращающие результаты поиска в разговорные сводки, а Tesla использует голосового ассистента Grok в своих автомобилях для управления навигацией и климат-контролем.
Не только крупные игроки делают такие ставки. На рынке появилось множество стартапов, пробующих жить без экранов: от носимых «Friend AI» в виде кулонов до экранных пинов и даже AI-колец от Sandbar и компании Эрика Миджиковски, основателя Pebble. Эти продукты по-разному воплощают идею голосового взаимодействия, но объединяет их одно — будущее, где аудио становится универсальным интерфейсом, доступным дома, в авто и в одежде.
OpenAI готовит к выпуску новую аудио-модель, запланированную на начало 2026 года. По ожиданиям, она будет звучать гораздо естественнее, способна обрабатывать перебивания в разговоре, а также отвечать во время речи пользователя – то есть приближаться к полноценной живой беседе, а не простому запрос-ответ. Компания также рассматривает создание семейства аудио-устройств без экранов, включая умные динамики и очки, которые должны ощущаться «не инструментами, а компаньонами».
Этот шаг частично связан с приходом в команду OpenAI бывшего главы дизайна Apple Джони Айва, который присоединился после покупки его дизайн-студии io за $6,5 млрд. Айв видит аудио-первый дизайн как способ уменьшить зависимость от экранов и исправить «негативные эффекты» прошлых гаджетов, которые слишком захватывают внимание пользователя.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
*Meta признана экстремистской организацией и запрещена в РФ.
Автор: cognitronn


