Yandex SpeechKit

Сервис распознаёт и синтезирует речь на нескольких языках.

SpeechKit — речевые технологии голосового помощника Алиса, адаптированные для использования в ваших бизнес-решениях.

Распознавание с учётом контекста
SpeechKit учитывает вероятности сочетания слов, а также лексические и стилистические особенности устной речи.
Синтез в реальном времени
Текст синтезируется с минимальной задержкой, и отлично работает в сервисах с потоковым воспроизведением.
Поддержка трёх языков
Сервис работает с аудиозаписями и текстами на трёх языках: русском, английском и турецком.
Премиум-голоса
Речь премиум-голосов состоит из миллиона отдельных фонем и звучит естественно. Перед началом синтеза сервис оценивает текст целиком и подбирает интонации, характерные для речи человека.
Прозрачное ценообразование
Стоимость распознавания аудиозаписи автоматически рассчитывается по длительности трека. Стоимость синтеза — по количеству символов.

Решайте свои задачи с Yandex SpeechKit

Автоматизация работы колл-центров

Автоматизируйте процесс распознавания и обработки информации для записи клиентов по телефону. Yandex SpeechKit распознает речь, выделит из нее фамилию, дату и время, на которое клиент хочет записаться и другую информацию. Освободите время сотрудников колл-центра для решения более сложных вопросов.

Телемаркетинговые кампании

Сообщайте пользователям однотипную информацию, обращаясь к каждому человеку по имени или другому идентификатору во время звонка. Технологии синтеза речи помогут персонализировать сообщение без участия операторов колл-центра.

Управление приложением

Добавьте возможность управлять вашим приложением с помощью голоса — это быстро и удобно. Yandex SpeechKit расшифрует голосовые команды, чтобы приложение могло отреагировать нужным образом.
Мы исключили человеческий фактор: теперь наши клиенты могут передать показания даже при самых пиковых нагрузках на линии нашего колл-центра. Тем самым мы улучшили клиентский сервис и «разгрузили» операторов для работы с более серьезными вопросами
Павел Гирев,
начальник отдела администрирования информационных систем ПАО «Пермэнергосбыт»
Читать историю

Вопросы и ответы

Как использовать SpeechKit?

Сервис работает через HTTP API. Всё, что нужно для работы, вы сможете найти в документации. Начните знакомство с сервисом самостоятельно или обратитесь к нам. Мы подберём партнёра, который разработает решение специально для вашей задачи.

Сервис работает через HTTP API. Всё, что нужно для работы, вы сможете найти в документации. Начните знакомство с сервисом самостоятельно или обратитесь к нам. Мы подберём партнёра, который разработает решение специально для вашей задачи.

Зачем регистрироваться в консоли Yandex.Cloud?

Для использования API необходимо получить идентификатор (IAM-токен или API-ключ). Этот идентификатор привязан к учетной записи в облаке.

Для использования API необходимо получить идентификатор (IAM-токен или API-ключ). Этот идентификатор привязан к учетной записи в облаке.

Что такое модель распознавания?

Модели распознавания — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. Это позволяет постоянно улучшать качество распознавания.

Модели распознавания — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. Это позволяет постоянно улучшать качество распознавания.

Какие форматы аудио поддерживает Yandex SpeechKit для распознавания?

Сервис позволяет распознавать аудио в форматах LPCM и OggOpus.

Сервис позволяет распознавать аудио в форматах LPCM и OggOpus.

Начните пользоваться SpeechKit