Yandex SpeechKit

Сервис распознавания и синтеза речи. Инфраструктура сервиса спроектирована с учётом высоких нагрузок, чтобы обеспечивать доступность и безотказную работу системы даже при большом количестве одновременных обращений. Именно на основе SpeechKit работает Алиса — голосовой помощник Яндекса.

Документация

  • Поддержка четырёх языков

    Сервис работает с аудио и текстами на четырёх языках: русском, английском, украинском и турецком. Поддержку каждого из этих языков легко добавить в любой момент — при выходе на новую аудиторию не потребуется подключать сервисы сторонних разработчиков.

  • Естественное звучание

    Если формировать речь из слов, произнесённых актёром, звучание получается неестественным. Yandex SpeechKit складывает речь более чем из миллиона отдельных фонем, а интонация задаётся нейросетью, обученной на множестве примеров из реальной жизни. Поэтому когда система воспроизводит текст, результат не режет слух.

  • Синтез в реальном времени

    Отправив текст для синтеза, ваш сервис или приложение сразу же получит в ответ аудиозапись: задержка настолько мала, что позволяет создавать программное обеспечение с потоковым воспроизведением.

  • Прозрачное ценообразование

    Когда вы присылаете аудиозапись, стоимость формируется по её длительности, а когда на вход подаётся текст — по количеству символов. Это позволяет строить точные прогнозы расходов.

  • Удобный API

    Для обмена данными с сервисом предусмотрен HTTP API. Поэтому вам не придется разворачивать и поддерживать свою инфраструктуру, чтобы в сжатые сроки реализовывать нужные функции.

Какие задачи можно решать с Yandex SpeechKit

  • Когда посетители постоянно вам звонят и сообщают однотипную информацию, можно автоматизировать процесс её занесения в базу. Yandex SpeechKit позволит распознать фамилию, дату и время, на которое клиент хочет записаться, а также другие произнесённые им фразы. Пусть сотрудники колл-центра уделяют внимание более сложным вопросам.

  • Добавьте возможность управлять вашим приложением с помощью голоса — многим вашим пользователям такой способ покажется более быстрым и удобным. Yandex SpeechKit расшифрует голосовые команды, чтобы приложение могло отреагировать нужным образом.

  • Допустим, вам необходимо в автоматическом режиме сообщить однотипную информацию множеству клиентов — но сделать каждое сообщение персонализированным. Например — обратиться к каждому человеку по имени, произнести во время звонка уникальный номер клиента и т. д. Технологии синтеза речи дают возможность наладить такой обзвон без участия операторов колл-центра.

  • Добавьте на ваш сервис голосовой интерфейс, чтобы для использования продуктов или услуг не требовалось читать текст на экране. Тогда людям с нарушениями зрения будет проще стать вашими клиентами.

  • Благодаря синтезу речи процесс распространения знаний легко упростить. Подготовьте текстовую версию ролика или вебинара, который вы собираетесь провести, и пусть Yandex SpeechKit сделает за вас весь остальной труд по подготовке видео. Незачем тратить рабочее время сотрудников или своё собственное время на озвучивание. Эту работу может выполнить автоматизированная система.

Попробуйте Yandex SpeechKit:

Все сервисы