VisionService
Статья создана
Набор методов для сервиса Yandex Vision.
Вызов | Описание |
---|---|
BatchAnalyze | Анализирует набор изображений и возвращает результаты с аннотациями. |
Вызовы VisionService
BatchAnalyze
Анализирует набор изображений и возвращает результаты с аннотациями.
rpc BatchAnalyze (BatchAnalyzeRequest) returns (BatchAnalyzeResponse)
BatchAnalyzeRequest
Поле | Описание |
---|---|
analyze_specs[] | AnalyzeSpec
|
folder_id | string Идентификатор каталога, к которому у вас есть доступ. Требуется для авторизации с пользовательским аккаунтом (см. ресурс yandex.cloud.iam.v1.UserAccount ) . Не используйте это поле, если вы делаете запрос от имени сервисного аккаунта. Максимальная длина строки в символах — 50. |
AnalyzeSpec
Поле | Описание |
---|---|
source | oneof: content |
content | bytes Содержимое изображения, представленное в виде потока байтов. Примечание: как и во всех полях с байтами, в protobuf используется чистое двоичное представление, тогда как в JSON-представлении используется base64. Максимальная длина строки в символах — 10485760. |
features[] | Feature Запрошенные возможности для анализа. Максимальное количество запрошенных возможностей для одного файла - 8. Количество элементов должно находиться в диапазоне от 1 до 8. |
mime_type | string MIME-тип контента (например, application/pdf ). Максимальная длина строки в символах — 255. |
Feature
Поле | Описание |
---|---|
type | enum Type Тип запрашиваемой возможности для анализа.
|
config | oneof: classification_config или text_detection_config |
classification_config | FeatureClassificationConfig Обязательно для типа CLASSIFICATION . Задает конфигурацию для классификации. |
text_detection_config | FeatureTextDetectionConfig Обязательно для типа TEXT_DETECTION . Задает конфигурацию для распознавания текста (OCR). |
FeatureClassificationConfig
Поле | Описание |
---|---|
model | string Модель, которая будет использоваться для анализа изображений. Максимальная длина строки в символах — 256. |
FeatureTextDetectionConfig
Поле | Описание |
---|---|
language_codes[] | string Список языков для распознавания текста. Указывается в формате ISO 639-1 (например, ru ). Количество элементов должно находиться в диапазоне от 1 до 8. Максимальная длина строки в символах для каждого значения — 3. |
model | string
|
BatchAnalyzeResponse
Поле | Описание |
---|---|
results[] | AnalyzeResult Результаты запроса. Результаты имеют тот же порядок, что и спецификации в запросе. |
AnalyzeResult
Поле | Описание |
---|---|
results[] | FeatureResult Результаты для каждой запрошенной возможности для анализа. Результаты имеют тот же порядок, что и указанные возможности в запросе. |
error | google.rpc.Status Возвращает информацию об ошибке, если ошибка произошла при обработке файла. |
FeatureResult
Поле | Описание |
---|---|
feature | oneof: text_detection , classification или face_detection |
text_detection | TextAnnotation Результат распознавания текста (OCR). |
classification | ClassAnnotation Результат классификации. |
face_detection | FaceAnnotation Результат обнаружения лиц. |
error | google.rpc.Status Возвращает информацию об ошибке, если ошибка произошла при выполнении анализа для указанной возможности. |
TextAnnotation
Поле | Описание |
---|---|
pages[] | Page Страницы распознанного файла. Для JPEG и PNG файлов содержит только 1 страницу. |
Page
Поле | Описание |
---|---|
width | int64 Ширина страницы в пикселях. |
height | int64 Высота страницы в пикселях. |
blocks[] | Block Распознанные блоки текста на этой странице. |
Block
Поле | Описание |
---|---|
bounding_box | Polygon Область на странице, где находится блок текста. |
lines[] | Line Распознанные строки в этом блоке. |
Polygon
Поле | Описание |
---|---|
vertices[] | Vertex Вершины обрамляющей фигуры. |
Vertex
Поле | Описание |
---|---|
x | int64 Координата по оси X в пикселях. |
y | int64 Координата по оси Y в пикселях. |
Line
Поле | Описание |
---|---|
bounding_box | Polygon Область на странице, где расположена строка. |
words[] | Word Распознанные слова в этой строке. |
confidence | double Достоверность результатов OCR для строки. Диапазон [0, 1]. |
Polygon
Поле | Описание |
---|---|
vertices[] | Vertex Вершины обрамляющей фигуры. |
Vertex
Поле | Описание |
---|---|
x | int64 Координата по оси X в пикселях. |
y | int64 Координата по оси Y в пикселях. |
Word
Поле | Описание |
---|---|
bounding_box | Polygon Область на странице, где расположена строка. |
text | string Распознанное слово. |
confidence | double Достоверность результатов OCR для слова. Диапазон [0, 1]. |
languages[] | DetectedLanguage Список распознанных языков и достоверность распознавания. |
DetectedLanguage
Поле | Описание |
---|---|
language_code | string Код распознанного языка. |
confidence | double Достоверность распознанного языка. Диапазон [0, 1]. |
Polygon
Поле | Описание |
---|---|
vertices[] | Vertex Вершины обрамляющей фигуры. |
Vertex
Поле | Описание |
---|---|
x | int64 Координата по оси X в пикселях. |
y | int64 Координата по оси Y в пикселях. |
ClassAnnotation
Поле | Описание |
---|---|
properties[] | Property Признаки, извлеченные указанной моделью. Например, если вы попросите оценить качество изображения, сервис может вернуть такие признаки, как good и bad . |
Property
Поле | Описание |
---|---|
name | string Имя признака. |
probability | double Вероятность для признака, от 0 до 1. |
FaceAnnotation
Поле | Описание |
---|---|
faces[] | Face Массив обнаруженных лиц для указанного изображения. |
Face
Поле | Описание |
---|---|
bounding_box | Polygon Область на изображении, где находится лицо. |
Polygon
Поле | Описание |
---|---|
vertices[] | Vertex Вершины обрамляющей фигуры. |
Vertex
Поле | Описание |
---|---|
x | int64 Координата по оси X в пикселях. |
y | int64 Координата по оси Y в пикселях. |