Правила тарификации для Yandex Foundation Models

Статья создана

Обновлена 15 мая 2024 г.

Из чего складывается стоимость использования Yandex Foundation Models
Цены
- Генерация текста в YandexGPT API
- Векторизация текста в YandexGPT API
Примеры расчета стоимости использования YandexGPT API
- Примеры расчета генерации текста
- Пример расчета векторизации текста

Yandex Foundation Models находится на стадии Preview. Сервис тарифицируется в соответствии с документом Специальные условия использования. Детализация использования YandexGPT API доступна в Yandex Cloud Billing как использование ресурсов Yandex Foundation Models.

В консоли управления новым пользователям без платежного аккаунта для тестирования доступны запросы к моделям:

YandexGPT API — 10 бесплатных запросов в час.
YandexART — 10 бесплатных запросов в сутки.

Из чего складывается стоимость использования Yandex Foundation Models

Единица тарификации

Использование сервиса Foundation Models детализируется в единицах тарификации — тарифицирующих юнитах. Стоимость одного тарифицирующего юнита различается для генерации и векторизации текста.

Генерация текста

Стоимость генерации текста рассчитывается из суммарного количества токенов промта и ответа и зависит от параметров запроса к YandexGPT API. Следующие параметры влияют на стоимость генерации текста:

модель, к которой приходит запрос;
режим работы модели.

Число токенов в промте и ответе для одного и того же текста для разных моделей может отличаться.

Итоговое количество потребленных юнитов вычисляется на основе суммарного числа токенов промта и ответа и округляется до целого значения в большую сторону.

Токенизация

Использование токенизатора (вызовы TokenizerService и методы Tokenizer) не тарифицируются.

Дообученные модели

Работа модели краткого пересказа тарифицируется по правилам YandexGPT Lite. Работа моделей, дообученных в Yandex DataSphere, тарифицируется по правилам YandexGPT Pro.

Векторизация текста

Стоимость представления текста в виде векторов (получения эмбеддингов по тексту) зависит от объема текста, поданного на векторизацию.

Генерация изображений

На стадии Preview использование YandexART не тарифицируется.

Внутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Цены

Генерация текста в YandexGPT API

Количество	Цена, вкл. НДС
1000 юнитов	0,20 ₽

Параметры модели	Количество юнитов в 1 токене	Цена за 1000 токенов, вкл. НДС
YandexGPT Lite, синхронный режим	1	0,20 ₽
YandexGPT Lite, асинхронный режим	0,5	0,10 ₽
YandexGPT Pro, синхронный режим	6	1,20 ₽
YandexGPT Pro, асинхронный режим	3	0,60 ₽
Краткий пересказ, синхронный режим	1	0,20 ₽
Краткий пересказ, асинхронный режим	0,5	0,10 ₽
Модель, дообученная в DataSphere, синхронный режим	6	1,20 ₽
Модель, дообученная в DataSphere, асинхронный режим	3	0,60 ₽

Векторизация текста в YandexGPT API

Количество	Цена, вкл. НДС
1000 юнитов	0,01 ₽

Параметры модели	Количество юнитов в 1 токене	Итоговая стоимость за обработку 1000 токенов, вкл. НДС
Получение эмбеддингов текста	1	0,01 ₽

Примеры расчета стоимости использования YandexGPT API

Примеры расчета генерации текста

Стоимость использования YandexGPT API для генерации текста со следующими параметрами:

количество токенов в промта — 225

количество токенов в ответе — 525

модель YandexGPT Lite

синхронный режим работы модели

Расчет стоимости:
Количество токенов в промте и ответе: 225 + 525 = 750
Количество юнитов в 1 токене для модели YandexGPT Lite в синхронном режиме: 1
Общее количество юнитов в детализации потребления: 750

Итого: (0,20 ₽ / 1000 юнитов) × 750 юнитов = 0,15 ₽.

Стоимость использования YandexGPT API для генерации текста со следующими параметрами:

число токенов промта — 115

число токенов в ответе — 1500

модель YandexGPT Pro

асинхронный режим работы модели

Расчет стоимости:
Количество токенов в промте и ответе: 115 + 1500 = 1615
Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 0,60 ₽
Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3
Общее количество юнитов в детализации потребления: 1615 × 3 = 4845

Итого: (0,60 ₽ / 1000 токенов) × 1615 токенов = 0,969 ₽, округляя до целого значения, 0,97 ₽.

Стоимость использования YandexGPT API для генерации текста со следующими параметрами:

количество токенов в промта — 1020

количество токенов в ответе — 30

модель YandexGPT Pro, дообученная в DataSphere

синхронный режим работы модели

Расчет стоимости:
Количество токенов в промте и ответе: 1020 + 30 = 1050
Цена за 1000 токенов для модели, дообученной в DataSphere, в синхронном режиме: 1,20 ₽
Количество юнитов в 1 токене для модели, дообученной в DataSphere, в синхронном режиме: 6
Общее количество юнитов в детализации потребления: 1050 × 6 = 6300

Итого: (0,20 ₽ / 1000 юнитов) × 6300 юнитов = 1,26 ₽ или (1,20 ₽ / 1000 токенов) × 1050 токенов = 1,26 ₽.

Пример расчета векторизации текста

Стоимость использования YandexGPT для векторизации текста со следующими параметрами:

число токенов в запросе — 2000

Расчет стоимости:

2000 × 1,0 × (0,01 ₽ / 1000) = 0,02 ₽

Итого: 0,02 ₽.

Где:

2000 — число токенов в запросе.
1,0 — коэффициент использования векторизации текста.
0,01 ₽ — стоимость обработки 1000 токенов.
0,01 ₽ / 1000 — стоимость обработки 1 токена.

Правила тарификации для Yandex Foundation Models

Из чего складывается стоимость использования Yandex Foundation ModelsИз чего складывается стоимость использования Yandex Foundation Models

Единица тарификацииЕдиница тарификации

Генерация текстаГенерация текста

ТокенизацияТокенизация

Дообученные моделиДообученные модели

Векторизация текстаВекторизация текста

Генерация изображенийГенерация изображений

Внутренние ошибки сервераВнутренние ошибки сервера

ЦеныЦены

Генерация текста в YandexGPT APIГенерация текста в YandexGPT API

Векторизация текста в YandexGPT APIВекторизация текста в YandexGPT API

Примеры расчета стоимости использования YandexGPT APIПримеры расчета стоимости использования YandexGPT API

Примеры расчета генерации текстаПримеры расчета генерации текста

Пример расчета векторизации текстаПример расчета векторизации текста

Была ли статья полезна?