Yandex Cloud
  • Сервисы
  • Решения
  • Почему Yandex Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Language / Region
© 2022 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Начало работы
  • Распознавание речи
    • О технологии
    • Потоковое распознавание
    • Распознавание аудиофайлов
      • Синхронное распознавание
      • Асинхронное распознавание
    • Модели распознавания
    • Расширение модели распознавания речи
    • Загрузка данных для дообучения модели
  • Синтез речи
    • О технологии
    • Список голосов
    • Настройка генерации речи
    • Использование SSML
    • Список поддерживаемых фонем в SSML
    • SpeechKit Brand Voice
      • О технологии SpeechKit Brand Voice
      • Формат входных данных Brand Voice Adaptive
      • Загрузка данных для Brand Voice
  • Форматы аудио
  • Интеграция телефонии
  • Использование API
    • Аутентификация в API
    • Формат ответа
    • Диагностика ошибок
    • Справочники API распознавания
      • API v2
        • API потокового распознавания
        • API синхронного распознавания
        • API асинхронного распознавания
      • API v3 gRPC (англ.)
        • Overview
        • Recognizer
    • Примеры использования API распознавания
      • Потоковое распознавание API v3
      • Потоковое распознавание API v2
      • Синхронное распознавание API v2
      • Асинхронное распознавание формата LPCM — API v2
      • Асинхронное распознавание формата OggOpus — API v2
    • Справочники API синтеза
      • API v1
      • API v3 gRPC (англ.)
        • Overview
        • Synthesizer
    • Примеры использования API синтеза
      • Синтез API v3
  • SpeechKit Hybrid
    • О технологии
    • Системные требования
    • Синтез речи
    • Распознавание речи
    • Мониторинг
    • Справочники API gRPC (англ.)
      • Аутентификация в API
      • Синтез речи
        • Overview
        • Synthesizer
      • Потоковое распознавание
        • Overview
        • Recognizer
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Релизы
    • Релизы распознавания
    • Релизы синтеза
    • Архив релизов
  • Публичные материалы
  • Вопросы и ответы
  1. SpeechKit Hybrid
  2. Распознавание речи

Распознавание речи

Статья создана
Yandex Cloud
  • Перед началом работы
  • Установка и настройка сервиса потокового распознавания
  • Тестирование производительности

Перед началом работы

  1. Установите на сервер Docker Engine и Docker Compose.

  2. Аутентифицируйтесь в Container Registry.

Рекомендуемую конфигурацию оборудования см. в разделе Системные требования.

Установка и настройка сервиса потокового распознавания

  1. Поместите полученный от команды SpeechKit файл docker-compose.yaml в папку на вашем сервере

  2. Отредактируйте docker-compose.yaml: вместо N укажите число потоков вашего процессора в параметре CPU_THREADS_NUM: N.

    В Linux вы можете узнать количество потоков вашего сервера, используя команду:

    cat /proc/cpuinfo | grep -E "processor.+:" | wc -l
    
  3. Скачайте все необходимые Docker-контейнеры:

    docker-compose pull
    
  4. Запустите сервис SpeechKit:

    docker-compose up -d
    
  5. Дождитесь загрузки сервиса

    docker logs stt-server
    
    stt-server  | Server listening on 0.0.0.0:50053
    stt-server  | Waiting for join...
    

Сервис распознавания речи будет доступен на TCP-порте 8080.

Тестирование производительности

  1. Скачайте контейнер с тестами:

    docker pull cr.yandex/${REGISTRY_ID}/stt-tools
    
  2. Запустите контейнер stt-tools:

    docker run -it --network=host \
       --env ENVOY_HOST="0.0.0.0" \
       --env ENVOY_PORT=8080 \
       --env CONNECTIONS=10 \
       stt-tools
    
    • ENVOY_HOST — IP-адрес сервиса распознавания. Если тесты запускаются на том же сервере, что и сервис распознавания, укажите значение 0.0.0.0.
    • ENVOY_PORT — порт сервиса распознавания (по умолчанию 8080).
    • CONNECTIONS — количество одновременно активных каналов.
  3. Результаты теста будут доступны в логах контейнера:

    docker logs stt-tools
    

Была ли статья полезна?

Language / Region
© 2022 ООО «Яндекс.Облако»
В этой статье:
  • Перед началом работы
  • Установка и настройка сервиса потокового распознавания
  • Тестирование производительности