Правила тарификации для Yandex Foundation Models
Yandex Foundation Models находится на стадии Preview. Сервис тарифицируется в соответствии с документом Специальные условия использования
В консоли управления
- YandexGPT API — 10 бесплатных запросов в час.
- YandexART — 10 бесплатных запросов в сутки.
Из чего складывается стоимость использования Yandex Foundation Models
Единица тарификации
Использование сервиса Foundation Models детализируется в единицах тарификации — тарифицирующих юнитах. Стоимость одного тарифицирующего юнита различается для генерации и векторизации текста.
Генерация текста
Стоимость генерации текста рассчитывается из суммарного количества токенов промта и ответа и зависит от параметров запроса к YandexGPT API. Следующие параметры влияют на стоимость генерации текста:
- модель, к которой приходит запрос;
- режим работы модели.
Число токенов в промте и ответе для одного и того же текста для разных моделей может отличаться.
Итоговое количество потребленных юнитов вычисляется на основе суммарного числа токенов промта и ответа и округляется до целого значения в большую сторону.
Токенизация
Использование токенизатора (вызовы TokenizerService и методы Tokenizer) не тарифицируются.
Дообученные модели
Работа модели краткого пересказа тарифицируется по правилам YandexGPT Lite. Работа моделей, дообученных в Yandex DataSphere, тарифицируется по правилам YandexGPT Pro.
Векторизация текста
Стоимость представления текста в виде векторов (получения эмбеддингов по тексту) зависит от объема текста, поданного на векторизацию.
Генерация изображений
На стадии Preview использование YandexART не тарифицируется.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.
Цены
Генерация текста в YandexGPT API
Количество | Цена, вкл. НДС |
---|---|
1000 юнитов | 0,20 ₽ |
Параметры модели | Количество юнитовв 1 токене | Цена за 1000 токенов,вкл. НДС |
---|---|---|
YandexGPT Lite, синхронный режим | 1 | 0,20 ₽ |
YandexGPT Lite, асинхронный режим | 0,5 | 0,10 ₽ |
YandexGPT Pro, синхронный режим | 6 | 1,20 ₽ |
YandexGPT Pro, асинхронный режим | 3 | 0,60 ₽ |
Краткий пересказ, синхронный режим | 1 | 0,20 ₽ |
Краткий пересказ, асинхронный режим | 0,5 | 0,10 ₽ |
Модель, дообученная в DataSphere, синхронный режим | 6 | 1,20 ₽ |
Модель, дообученная в DataSphere, асинхронный режим | 3 | 0,60 ₽ |
Векторизация текста в YandexGPT API
Количество | Цена, вкл. НДС |
---|---|
1000 юнитов | 0,01 ₽ |
Параметры модели | Количество юнитовв 1 токене | Итоговая стоимость за обработку 1000 токенов, вкл. НДС |
---|---|---|
Получение эмбеддингов текста | 1 | 0,01 ₽ |
Примеры расчета стоимости использования YandexGPT API
Примеры расчета генерации текста
Стоимость использования YandexGPT API для генерации текста со следующими параметрами:
- количество токенов в промта — 225
- количество токенов в ответе — 525
- модель YandexGPT Lite
- синхронный режим работы модели
Расчет стоимости:
Количество токенов в промте и ответе: 225 + 525 = 750
Количество юнитов в 1 токене для модели YandexGPT Lite в синхронном режиме: 1
Общее количество юнитов в детализации потребления: 750
Итого: (0,20 ₽ / 1000 юнитов) × 750 юнитов = 0,15 ₽.
Стоимость использования YandexGPT API для генерации текста со следующими параметрами:
- число токенов промта — 115
- число токенов в ответе — 1500
- модель YandexGPT Pro
- асинхронный режим работы модели
Расчет стоимости:
Количество токенов в промте и ответе: 115 + 1500 = 1615
Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 0,60 ₽
Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3
Общее количество юнитов в детализации потребления: 1615 × 3 = 4845
Итого: (0,60 ₽ / 1000 токенов) × 1615 токенов = 0,969 ₽, округляя до целого значения, 0,97 ₽.
Стоимость использования YandexGPT API для генерации текста со следующими параметрами:
- количество токенов в промта — 1020
- количество токенов в ответе — 30
- модель YandexGPT Pro, дообученная в DataSphere
- синхронный режим работы модели
Расчет стоимости:
Количество токенов в промте и ответе: 1020 + 30 = 1050
Цена за 1000 токенов для модели, дообученной в DataSphere, в синхронном режиме: 1,20 ₽
Количество юнитов в 1 токене для модели, дообученной в DataSphere, в синхронном режиме: 6
Общее количество юнитов в детализации потребления: 1050 × 6 = 6300
Итого: (0,20 ₽ / 1000 юнитов) × 6300 юнитов = 1,26 ₽ или (1,20 ₽ / 1000 токенов) × 1050 токенов = 1,26 ₽.
Пример расчета векторизации текста
Стоимость использования YandexGPT для векторизации текста со следующими параметрами:
- число токенов в запросе — 2000
Расчет стоимости:
2000 × 1,0 × (0,01 ₽ / 1000) = 0,02 ₽
Итого: 0,02 ₽.
Где:
- 2000 — число токенов в запросе.
- 1,0 — коэффициент использования векторизации текста.
- 0,01 ₽ — стоимость обработки 1000 токенов.
- 0,01 ₽ / 1000 — стоимость обработки 1 токена.