Распознавание речи
Статья создана
Перед началом работы
-
Установите на сервер Docker Engine и Docker Compose.
-
Аутентифицируйтесь в Container Registry.
Рекомендуемую конфигурацию оборудования см. в разделе Системные требования.
Установка и настройка сервиса потокового распознавания
-
Поместите полученный от команды SpeechKit файл
docker-compose.yaml
в папку на вашем сервере -
Отредактируйте
docker-compose.yaml
: вместоN
укажите число потоков вашего процессора в параметреCPU_THREADS_NUM: N
.В Linux вы можете узнать количество потоков вашего сервера, используя команду:
cat /proc/cpuinfo | grep -E "processor.+:" | wc -l
-
Скачайте все необходимые Docker-контейнеры:
docker-compose pull
-
Запустите сервис SpeechKit:
docker-compose up -d
-
Дождитесь загрузки сервиса
docker logs stt-server
stt-server | Server listening on 0.0.0.0:50053 stt-server | Waiting for join...
Сервис распознавания речи будет доступен на TCP-порте 8080.
Тестирование производительности
-
Скачайте контейнер с тестами:
docker pull cr.yandex/${REGISTRY_ID}/stt-tools
-
Запустите контейнер
stt-tools
:docker run -it --network=host \ --env ENVOY_HOST="0.0.0.0" \ --env ENVOY_PORT=8080 \ --env CONNECTIONS=10 \ stt-tools
ENVOY_HOST
— IP-адрес сервиса распознавания. Если тесты запускаются на том же сервере, что и сервис распознавания, укажите значение0.0.0.0
.ENVOY_PORT
— порт сервиса распознавания (по умолчанию8080
).CONNECTIONS
— количество одновременно активных каналов.
-
Результаты теста будут доступны в логах контейнера:
docker logs stt-tools