Правила тарификации для SpeechKit

Статья создана

Обновлена 10 апреля 2024 г.

Из чего складывается стоимость использования SpeechKit
Цены

Чтобы рассчитать стоимость использования сервиса, воспользуйтесь калькулятором на сайте Yandex Cloud, или ознакомьтесь с тарифами в этом разделе.

Из чего складывается стоимость использования SpeechKit

Использование синтеза речи

Стоимость использования SpeechKit для синтеза речи зависит от версии используемого API.

API v1

Для API v1 стоимость рассчитывается исходя из суммарного количества символов, которые были отправлены для генерации речи из текста за календарный месяц (Отчетный период).

API v3

Стоимость использования API v3 зависит от количества отправленных запросов на синтез. Стоимость рассчитывается за календарный месяц (Отчетный период).

По умолчанию запросы на синтез речи имеют ограничения — 250 символов и 24 секунды. Для синтеза более длинных фраз можно использовать режим unsafe_mode. Тогда тарифицироваться будут каждые 250 символов, например:

Запрос меньше 250 символов — одна единица тарификации.
Запрос от 250 до 500 символов — две единицы тарификации.
Запрос от 500 до 750 символов — три единицы тарификации.

Пустой запрос

Количество символов в запросе определяется с учетом пробелов и служебных символов. Стоимость пустого запроса зависит от версии API:

Пустой запрос к API v1 тарифицируется как один символ.
Пустой запрос к API v3 тарифицируется как одна единица тарификации.

Внутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Использование распознавания речи

Стоимость использования SpeechKit для распознавания речи зависит от типа распознавания и длительности распознанного аудио. Стоимость рассчитывается за календарный месяц (Отчетный период).

Потоковый режим распознавания

Стоимость использования SpeechKit в режиме потокового распознавания рассчитывается по правилам тарификации синхронного распознавания.

Синхронное распознавание

Эти правила действуют при использовании синхронного распознавания и распознавания в потоковом режиме при использовании API v2 и API v3.

Единица тарификации — отрезок одноканального аудио длительностью 15 секунд. Отрезки меньшей длительности округляются в большую сторону (1 секунда превращается в 15 секунд).

Важно

В потоковом режиме тарификация начинается с отправки сообщения с настройками распознавания. Даже если вы не отправляли аудио после этого сообщения, это будет считаться как использованная единица тарификации.

Примеры:

1 аудиофрагмент 37 секунд тарифицируется как 45 секунд.

Объяснение: аудио разбивается на 2 отрезка по 15 секунд и один отрезок 7 секунд. Длительность последнего отрезка будет округлена до 15 секунд. Итого, 3 отрезка по 15 секунд.

2 аудиофрагмента по 5 и 8 секунд тарифицируются как 30 секунд.

Объяснение: длительность каждого аудио будет округлена до 15 секунд. Итого, 2 отрезка по 15 секунд.

Асинхронное распознавание

Эти правила действуют при использовании асинхронного распознавания.

Единица тарификации — 1 секунда двухканального аудио. Отрезки меньшей длительности округляются в большую сторону. Количество каналов округляется до четного числа.

Минимум начисляется 15 секунд за каждые два канала. Аудио меньшей длительности тарифицируется, как 15 секунд.

Примеры с округлением длительности аудио:

Длительность	Количество каналов	Начислено секунд
1 секунда	1	15
1 секунда	2	15
1 секунда	3	30
15.5 секунд	2	16
15.5 секунд	4	32

Пустой запрос

Пустой запрос к любому типу распознавания равен стоимости одной единицы тарификации.

Внутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Примеры расчета стоимости

Синтез речи с использованием API v1

Стоимость использования SpeechKit для синтеза речи с использованием API v1 со следующими параметрами:

Количество символов, отправленных за месяц: 2023.

Расчет стоимости:

2023 × (1320,00 / 1 000 000) = 2,67 ₽

Итого: 2,67 ₽.

Где:

1320,00 — стоимость за 1 млн символов.
1320,00 / 1 000 000 — стоимость за 1 символ.

Синтез речи с использованием API v3

Стоимость использования SpeechKit для синтеза речи с использованием API v3 со следующими параметрами:

Количество отправленных запросов: 3.
Количество символов в запросах: 150, 300, 600.

Расчет стоимости:

(1 + 2 + 3) × 0,16 = 0,96 ₽

Итого: 0,96 ₽.

Где:

1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима unsafe_mode.
3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима unsafe_mode.
0,16 — стоимость единицы тарификации.

Распознавание речи в потоковом режиме

Стоимость использования SpeechKit для распознавания речи в потоковом режиме со следующими параметрами:

Количество аудиофрагментов: 2.
Длительность аудиофрагментов: 5 секунд, 37 секунд.

Расчет стоимости:

((1 + 1) + (3 + 1)) × 0,16 = 0,96 ₽

Итого: 0,96 ₽.

Где:

(1 + 1) — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд и учетом сообщения с настройками распознавания.
(3 + 1) — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд и учетом сообщения с настройками распознавания.
0,16 — стоимость единицы тарификации.

Распознавание речи в синхронном режиме

Стоимость использования SpeechKit для распознавания речи в синхронном режиме со следующими параметрами:

Количество аудиофрагментов: 2.
Длительность аудиофрагментов: 5 секунд, 37 секунд.

Расчет стоимости:

(1 + 3) × 0,16 = 0,64 ₽

Итого: 0,64 ₽.

Где:

1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
0,16 — стоимость единицы тарификации.

Распознавание речи в асинхронном режиме

Стоимость использования SpeechKit для распознавания речи в асинхронном режиме со следующими параметрами:

Количество аудиофрагментов: 4.
Длительность аудиофрагментов: 5 секунд, 5 секунд, 15.5 секунд, 15.5 секунд.
Количество каналов в аудиофрагментах: 1, 3, 2, 4.

Расчет стоимости:

(15 + 30 + 16 + 32) × 0,01 = 0,93 ₽

Итого: 0,93 ₽.

Где:

15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
0,01 — стоимость единицы тарификации.

Распознавание речи в асинхронном отложенном режиме

Стоимость использования SpeechKit для распознавания речи в асинхронном отложенном режиме со следующими параметрами:

Количество аудиофрагментов: 3.
Длительность аудиофрагментов: 2 секунды, 14 секунд, 19.5 секунд.
Количество каналов в аудиофрагментах: 2, 3, 4.

Расчет стоимости:

(15 + 30 + 40) × 0,0025 = 0,21 ₽

Итого: 0,21 ₽.

Где:

15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
0,0025 — стоимость единицы тарификации.

Цены

Синтез речи

Услуга	Цена за единицу тарификации, вкл. НДС
Синтез с использованием API v1, за 1 млн символов	1 320,00 ₽
Синтез с использованием API v3, за запрос	0,16 ₽

SpeechKit Brand Voice

Услуга	Цена за единицу тарификации, вкл. НДС
Хостинг модели SpeechKit Brand Voice Self Service, за месяц	По запросу
Хостинг модели SpeechKit Brand Voice Premium, за месяц	По запросу
Запрос к модели SpeechKit Brand Voice Call Center	0,16 ₽
Запрос к модели SpeechKit Brand Voice Self Service	0,16 ₽
Запрос к модели SpeechKit Brand Voice Premium	0,16 ₽

Распознавание речи

Услуга	Цена за единицу тарификации, вкл. НДС
Потоковое распознавание	0,16 ₽
Синхронное распознавание файлов	0,16 ₽
Асинхронное распознавание файлов	0,01 ₽
Асинхронное распознавание файлов, отложенный режим	0,0025 ₽

Правила тарификации для SpeechKit

Из чего складывается стоимость использования SpeechKitИз чего складывается стоимость использования SpeechKit

Использование синтеза речиИспользование синтеза речи

API v1API v1

API v3API v3

Пустой запросПустой запрос

Внутренние ошибки сервераВнутренние ошибки сервера

Использование распознавания речиИспользование распознавания речи

Потоковый режим распознаванияПотоковый режим распознавания

Синхронное распознаваниеСинхронное распознавание

Асинхронное распознаваниеАсинхронное распознавание

Пустой запросПустой запрос

Внутренние ошибки сервераВнутренние ошибки сервера

Примеры расчета стоимостиПримеры расчета стоимости

Синтез речи с использованием API v1Синтез речи с использованием API v1

Синтез речи с использованием API v3Синтез речи с использованием API v3

Распознавание речи в потоковом режимеРаспознавание речи в потоковом режиме

Распознавание речи в синхронном режимеРаспознавание речи в синхронном режиме

Распознавание речи в асинхронном режимеРаспознавание речи в асинхронном режиме

Распознавание речи в асинхронном отложенном режимеРаспознавание речи в асинхронном отложенном режиме

ЦеныЦены

Синтез речиСинтез речи

SpeechKit Brand VoiceSpeechKit Brand Voice

Распознавание речиРаспознавание речи

Была ли статья полезна?

Из чего складывается стоимость использования SpeechKit

Использование синтеза речи

API v1

API v3

Пустой запрос

Внутренние ошибки сервера

Использование распознавания речи

Потоковый режим распознавания

Синхронное распознавание

Асинхронное распознавание

Пустой запрос

Внутренние ошибки сервера

Примеры расчета стоимости

Синтез речи с использованием API v1

Синтез речи с использованием API v3

Распознавание речи в потоковом режиме

Распознавание речи в синхронном режиме

Распознавание речи в асинхронном режиме

Распознавание речи в асинхронном отложенном режиме

Цены

Синтез речи

SpeechKit Brand Voice

Распознавание речи