New

CallBack адрес для распознавания потокового аудио

Для обработки телефонных переговоров налету в текущей версии SpeechKit требуется, что бы отправка аудио в SpeechKit и обработка ответов от него была на одном сервере. Но IT служба не позволит разместить ресурсоёмкие ML приложения на сервере АТС, максимум, они согласны настроить АТС runtime на нарезку звонка на фрагменты и отправку этих фрагментов в SpeechKit сервис. Ожидается такая схема обработки потокового аудио: – АТС открывает сессию связи с сервисом SpeechKit с указанием CallBack адреса – АТС отправляет на CallBack адрес сообщение о новом телефонном звонке – сервер по CallBack адресу открывает сессию приёма распознанных текстов из этого телефонного звонка – АТС нарезает поток на кусочки и отправляет их в SpeechKit – SpeechKit обрабатывает аудио и распознанные тексты отправляет на CallBack адрес – сервер по CallBack адресу принимает тексты и складывает их в сессию обработки звонка и готовые фразы передаёт на обработку в ML приложение – АТС поддерживает отправку фрагментов переоткрытием сессий связи из-за ограничения в 5 минут на сессию до окончания телефонного разговора – АТС отправляет на CallBack адрес сообщение о завешении телефонного звонка То есть сейчас в SpeechKit не хватает параметров CallBack адреса и ID звонка при обработке потокового аудио. Ну и возврата распознанных текстов с меткой ID звонка на CallBack адрес.

CallBack адрес для распознавания потокового аудио

Для работы

Почему Yandex Cloud

Сообщество

Компания

Контакты