Обрести свой голос: сложность выбора TTS-архитектуры для ИИ-агента
Продолжаю писать о разработке собственного TTS-сервиса, основанный на шишках, набитых в targetai. В первой статье я описал критерии оценки и методологию бенчмарка. В этой статье речь пойдет о том, как мы с командой применили эти критерии на практике.Дисклеймеры:
Как мы голос для ИИ-ассистента выбирали или критерии оценки TTS-движков
targetai специализируется на создании ИИ-ассистентов для клиентского сервиса. И голосовые агенты для нас — один из ключевых сценариев: телефония, входящие и исходящие звонки, сервисные диалоги. На определённом этапе мы с командой пришли к пониманию, что зависимость от вендорских TTS-сервисов — это риск: по стоимости, по контролю над качеством, по гибкости под конкретных клиентов. И тогда перед нами встал вопрос о собственном сервисе синтеза речи.Первый шаг, который оказался совсем не тривиальным — договориться между собой о том, что вообще считать «хорошим голосом» для ИИ-агента
«Аэрофлот» представил цифрового аватара «Василису»
«Аэрофлот» представил на ЦИПР диалоговый интерактивный аватар на базе искусственного интеллекта, который будет помогать пассажирам в аэропортах. «Василиса» работает с использованием LLM-модели и технологии RAG. Проект находится на этапе подготовки к промышленному внедрению и масштабированию.
Заставляем голосовых ассистентов Марусю и Салют материться без принуждения и спецсредств
Всем привет! Не такую первую публикацию я планировал сделать на Хабр: есть пара более серьёзных и интересных тем, которыми я планирую поделиться, но перфекционизм пока не даёт их добить.А тут получилась спонтанная и короткая история из разряда «поигрался - проиграл задумался», которая неожиданно упёрлась в этику и безопасность.
«Т‑банк» тестирует голосовые переводы между клиентами
«Т‑банк» тестирует возможность переводить деньги между физлицами с помощью голосового ассистента. Функция пока проходит испытания на закрытой группе пользователей,
ИИ в логистике и складской автоматизации: глобальные тренды и российская реальность
Почему умные склады в РФ — это пока редкость?Привет, Хабр!Мы в INTEKEY
Нельзя просто так взять и заменить тысячи строк кода на промпты. Мы убедились в этом на практике
Привет, Хабр!
Чат-бот Apple под названием Veritas предназначен для тестирования ИИ-обновлений Siri и доступен сотрудникам компании
Сотрудники Apple используют чат-бот под названием Veritas для тестирования обновлённых функций на базе искусственного интеллекта голосового помощника Siri, рассказал обозреватель Bloomberg Марк Гурман со ссылкой на источники. Veritas предоставляет корпорации возможность быстро разрабатывать, тестировать и собирать отзывы о новых функциях Siri.

