Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представляет Voxtral — модель распознавания речи с открытым исходным кодом. Она обещает заменить проприетарные решения, предлагая при этом вдвое меньшую стоимость.
Elevenlabs представил 11ai — голосового помощника с MCP для интеграции в инструменты цифрового документооборота
Компания ElevenLabs представляет новый продукт — 11ai, который представляет собой голосового ИИ-помощника, предназначенного для активного участия в цифровых рабочих процессах. Альфа-версия предназначена для демонстрации возможностей технологии, ориентированной на голос, и интеграции с API.
Интерфейсы без экрана: как разговаривают голосовые ассистенты, когда никто не слышит
А что если ваш голосовой ассистент никогда не замолкает? Даже когда экран темный, а в комнате мертвая тишина, он ведет свою тайную беседу. Не с вами, а с тысячами серверов. О чем? О вас. В этой статье я предлагаю разобрать механизмы этого фонового «общения»: что именно передается в тишине и как это работает. Детали, как всегда, под катом.
Microsoft начала тестировать голосовой запуск «Hey, Copilot!» в Windows
Microsoft тестирует функцию для Copilot Voice, которая позволит пользователям Windows 11 начать разговор с приложением с фразы «Привет, Copilot!». Функция доступна участникам программы Windows Insiders.
Как я запустил ИИ сервис речевой аналитики который хотели все — и понял: рынка SaaS больше нет. Полный разбор
В этом тексте — живой кейс внедрения речевой аналитики в крупнейшей онлайн-школе EasyCode.Как мы пытались поднять конверсию, контролируя скрипты.Почему бинарная проверка «сказал ⁄ не сказал» не спасла продажи.Откуда взялся феномен «вежливого тумана» — сделка ещё вежлива, но уже мертва.Как идея тайм-лайна коммуникаций вывела нас к собственным паттернам риска и успеха.И зачем теперь выгоднее собрать аналитику своими руками (один dev, три дня), чем покупать очередную коробку.Первый серьёзный вызов
Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT
Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».
Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим
«Яндекс» представила обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».
Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов
Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.
Беспрецедентный сдвиг в голосовых интерфейсах ИИ
Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Сегодняшний перевод — When machines learn to speak

