Правила тарификации для SpeechKit

Чтобы расчитать стоимость использования сервиса, воспользуйтесь нашим калькулятором или ознакомьтесь с тарифами в этом разделе.

Из чего складывается стоимость использования SpeechKit

Использование синтеза речи

Стоимость использования SpeechKit API для синтеза речи рассчитывается исходя из используемого голоса и суммарного количества символов, которые были отправлены для генерации речи из текста за календарный месяц (Отчетный период).

Количество символов в запросе определяется с учетом пробелов и служебных символов. Стоимость пустого запроса равна стоимости одного символа.

Использование распознавания речи

Стоимость использования зависит от длительности распознанного аудио. Стоимость рассчитывается за календарный месяц (Отчетный период).

Распознавание коротких аудио

Эти правила действуют при использовании распознавания коротких аудио с помощью запроса или в потоковом режиме.

Единица тарификации — отрезок одноканального аудио длительностью 15 секунд. Отрезки меньшей длительности округляются в большую сторону (1 секунда превращается в 15 секунд).

Важная информация

В потоковом режиме тарификация начинается с отправки сообщения с настройками распознавания. Даже если вы не отправляли аудио после этого сообщения, это будет считаться как использованная единица тарификации.

Примеры:

  • 1 аудиофрагмент 37 секунд тарифицируется как 45 секунд.

    Объяснение: аудио разбивается на 2 отрезка по 15 секунд и один отрезок 7 секунд. Длительность последнего отрезка будет округлена до 15 секунд. Итого, 3 отрезка по 15 секунд.

  • 2 аудиофрагмента по 5 и 8 секунд тарифицируются как 30 секунд.

    Объяснение: длительность каждого аудио будет округлена до 15 секунд. Итого, 2 отрезка по 15 секунд.

Распознавание длинных аудио

Эти правила действуют при использовании распознавания длинных аудио.

Единица тарификации — 1 секунда двухканального аудио. Отрезки меньшей длительности округляются в большую сторону. Количество каналов округляется до четного числа.

Минимум начисляется 15 секунд за каждые два канала. Аудио меньшей длительности тарифицируется, как 15 секунд.

Примеры с округлением длительности аудио:

Длительность Количество каналов Начислено секунд
1 секунда 1 15
1 секунда 2 15
1 секунда 3 30
15.5 секунд 2 16
15.5 секунд 4 32

Цены

Синтез речи

Услуга Цена за 1 млн символов,
вкл. НДС
Синтез с использованием стандартных голосов 183,0508 ₽
Синтез с использованием премиум-голосов 1200 ₽

Распознавание речи

Услуга Цена за единицу тарификации,
вкл. НДС
Распознавание коротких аудио 0,1524 ₽
Распознавание длинных аудио 0,01 ₽