телефония.

Как мы голос для ИИ-ассистента выбирали или критерии оценки TTS-движков

targetai специализируется на создании ИИ-ассистентов для клиентского сервиса. И голосовые агенты для нас — один из ключевых сценариев: телефония, входящие и исходящие звонки, сервисные диалоги. На определённом этапе мы с командой пришли к пониманию, что зависимость от вендорских TTS-сервисов — это риск: по стоимости, по контролю над качеством, по гибкости под конкретных клиентов. И тогда перед нами встал вопрос о собственном сервисе синтеза речи.Первый шаг, который оказался совсем не тривиальным — договориться между собой о том, что вообще считать «хорошим голосом» для ИИ-агента

продолжить чтение

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One

Привет! Распознаванием речи (ASR) уже никого не удивишь, но качественное распознавание на разговорном русском языке, а особенно в телефонии — очень сложная штука: люди редко говорят как профессиональные дикторы, часто бывает плохое качество звука с постоянными шумами на фоне и в целом есть миллиарды прочих нюансов. Наша компания занимается голосом больше 8 лет, есть собственные классные модели синтеза, распознавания и продукты на их основе, поэтому экспериментов мы проводим очень много и за появлением новых голосовых моделей следим очень внимательно. 

продолжить чтение

ИИ в бизнес-коммуникациях: как технологии меняют правила игры в 2025 году

В 2025 году мало что впечатляет так, как ИИ в IP-телефонии. Забудьте про автоответчики с «нажмите 1» и долгие ожидания. Сегодня это умные боты, речевая аналитика и звонки без помех. Расскажу, как ИИ трансформирует бизнес-коммуникации, какие технологии уже работают и почему это выгодно.Почему ИИ в телефонии – это стандарт?

продолжить чтение