Yandex Cloud
  • Сервисы
  • Решения
  • Почему Yandex Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Language / Region
© 2022 ООО «Яндекс.Облако»
Yandex Vision
  • Начало работы
  • Пошаговые инструкции
    • Все инструкции
    • Распознавание текста
    • Определение качества изображения
    • Модерирование изображений
    • Обнаружение лиц
    • Кодирование в Base64
  • Концепции
    • Обзор
    • Распознавание текста
      • Обзор
      • Распознавание шаблонов
      • Поддерживаемые языки
      • Ограничения в текущей версии
    • Классификация изображений
      • Обзор
      • Поддерживаемые модели
    • Обнаружение лиц
    • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Справочники API
    • Аутентификация в API
    • APIv1
      • gRPC
        • Обзор
        • VisionService
      • REST
        • Обработка ошибок
        • Диагностика ошибок
        • Обзор
        • Vision
          • Обзор
          • batchAnalyze
    • Classifier API (англ.)
      • gRPC
        • Overview
        • ImageClassifierService
  • Вопросы и ответы
  1. Справочники API
  2. APIv1
  3. gRPC
  4. VisionService

VisionService

Статья создана
Yandex.Cloud
  • Вызовы VisionService
  • BatchAnalyze
    • BatchAnalyzeRequest
    • AnalyzeSpec
    • Feature
    • FeatureClassificationConfig
    • FeatureTextDetectionConfig
    • BatchAnalyzeResponse
    • AnalyzeResult
    • FeatureResult
    • TextAnnotation
    • Page
    • Block
    • Polygon
    • Vertex
    • Line
    • Polygon
    • Vertex
    • Word
    • DetectedLanguage
    • Polygon
    • Vertex
    • ClassAnnotation
    • Property
    • FaceAnnotation
    • Face
    • Polygon
    • Vertex

Набор методов для сервиса Yandex Vision.

Вызов Описание
BatchAnalyze Анализирует набор изображений и возвращает результаты с аннотациями.

Вызовы VisionService

BatchAnalyze

Анализирует набор изображений и возвращает результаты с аннотациями.

rpc BatchAnalyze (BatchAnalyzeRequest) returns (BatchAnalyzeResponse)

BatchAnalyzeRequest

Поле Описание
analyze_specs[] AnalyzeSpec
  • Поддерживаемые форматы файлов: JPEG, PNG.
  • Максимальный размер файла: 1 МБ.
  • Размер изображения не должен превышать 20 мегапикселей (длина x ширина).
Количество элементов должно находиться в диапазоне от 1 до 8.
folder_id string
Идентификатор каталога, к которому у вас есть доступ. Требуется для авторизации с пользовательским аккаунтом (см. ресурс yandex.cloud.iam.v1.UserAccount) . Не используйте это поле, если вы делаете запрос от имени сервисного аккаунта. Максимальная длина строки в символах — 50.

AnalyzeSpec

Поле Описание
source oneof: content
  content bytes
Содержимое изображения, представленное в виде потока байтов. Примечание: как и во всех полях с байтами, в protobuf используется чистое двоичное представление, тогда как в JSON-представлении используется base64. Максимальная длина строки в символах — 10485760.
features[] Feature
Запрошенные возможности для анализа.
Максимальное количество запрошенных возможностей для одного файла - 8. Количество элементов должно находиться в диапазоне от 1 до 8.
mime_type string
MIME-тип контента (например, application/pdf). Максимальная длина строки в символах — 255.

Feature

Поле Описание
type enum Type
Тип запрашиваемой возможности для анализа.
  • TEXT_DETECTION: Распознавание текста (OCR).
  • CLASSIFICATION: Возможность Классификация.
  • FACE_DETECTION: Возможность Обнаружение лиц.
    config oneof: classification_config или text_detection_config
      classification_config FeatureClassificationConfig
    Обязательно для типа CLASSIFICATION. Задает конфигурацию для классификации.
      text_detection_config FeatureTextDetectionConfig
    Обязательно для типа TEXT_DETECTION. Задает конфигурацию для распознавания текста (OCR).

    FeatureClassificationConfig

    Поле Описание
    model string
    Модель, которая будет использоваться для анализа изображений. Максимальная длина строки в символах — 256.

    FeatureTextDetectionConfig

    Поле Описание
    language_codes[] string
    Список языков для распознавания текста. Указывается в формате ISO 639-1 (например, ru). Количество элементов должно находиться в диапазоне от 1 до 8. Максимальная длина строки в символах для каждого значения — 3.
    model string
    • page (по умолчанию) — эта модель подходит для распознавания изображений со множеством текстовых блоков на нем.
    • line — эта модель подходит для обрезанных изображений, которые содержат одну строку текста.
    Максимальная длина строки в символах — 50.

    BatchAnalyzeResponse

    Поле Описание
    results[] AnalyzeResult
    Результаты запроса. Результаты имеют тот же порядок, что и спецификации в запросе.

    AnalyzeResult

    Поле Описание
    results[] FeatureResult
    Результаты для каждой запрошенной возможности для анализа. Результаты имеют тот же порядок, что и указанные возможности в запросе.
    error google.rpc.Status
    Возвращает информацию об ошибке, если ошибка произошла при обработке файла.

    FeatureResult

    Поле Описание
    feature oneof: text_detection, classification или face_detection
      text_detection TextAnnotation
    Результат распознавания текста (OCR).
      classification ClassAnnotation
    Результат классификации.
      face_detection FaceAnnotation
    Результат обнаружения лиц.
    error google.rpc.Status
    Возвращает информацию об ошибке, если ошибка произошла при выполнении анализа для указанной возможности.

    TextAnnotation

    Поле Описание
    pages[] Page
    Страницы распознанного файла.
    Для JPEG и PNG файлов содержит только 1 страницу.

    Page

    Поле Описание
    width int64
    Ширина страницы в пикселях.
    height int64
    Высота страницы в пикселях.
    blocks[] Block
    Распознанные блоки текста на этой странице.

    Block

    Поле Описание
    bounding_box Polygon
    Область на странице, где находится блок текста.
    lines[] Line
    Распознанные строки в этом блоке.

    Polygon

    Поле Описание
    vertices[] Vertex
    Вершины обрамляющей фигуры.

    Vertex

    Поле Описание
    x int64
    Координата по оси X в пикселях.
    y int64
    Координата по оси Y в пикселях.

    Line

    Поле Описание
    bounding_box Polygon
    Область на странице, где расположена строка.
    words[] Word
    Распознанные слова в этой строке.
    confidence double
    Достоверность результатов OCR для строки. Диапазон [0, 1].

    Polygon

    Поле Описание
    vertices[] Vertex
    Вершины обрамляющей фигуры.

    Vertex

    Поле Описание
    x int64
    Координата по оси X в пикселях.
    y int64
    Координата по оси Y в пикселях.

    Word

    Поле Описание
    bounding_box Polygon
    Область на странице, где расположена строка.
    text string
    Распознанное слово.
    confidence double
    Достоверность результатов OCR для слова. Диапазон [0, 1].
    languages[] DetectedLanguage
    Список распознанных языков и достоверность распознавания.

    DetectedLanguage

    Поле Описание
    language_code string
    Код распознанного языка.
    confidence double
    Достоверность распознанного языка. Диапазон [0, 1].

    Polygon

    Поле Описание
    vertices[] Vertex
    Вершины обрамляющей фигуры.

    Vertex

    Поле Описание
    x int64
    Координата по оси X в пикселях.
    y int64
    Координата по оси Y в пикселях.

    ClassAnnotation

    Поле Описание
    properties[] Property
    Признаки, извлеченные указанной моделью.
    Например, если вы попросите оценить качество изображения, сервис может вернуть такие признаки, как good и bad.

    Property

    Поле Описание
    name string
    Имя признака.
    probability double
    Вероятность для признака, от 0 до 1.

    FaceAnnotation

    Поле Описание
    faces[] Face
    Массив обнаруженных лиц для указанного изображения.

    Face

    Поле Описание
    bounding_box Polygon
    Область на изображении, где находится лицо.

    Polygon

    Поле Описание
    vertices[] Vertex
    Вершины обрамляющей фигуры.

    Vertex

    Поле Описание
    x int64
    Координата по оси X в пикселях.
    y int64
    Координата по оси Y в пикселях.

    Была ли статья полезна?

    Language / Region
    © 2022 ООО «Яндекс.Облако»
    В этой статье:
    • Вызовы VisionService
    • BatchAnalyze
    • BatchAnalyzeRequest
    • AnalyzeSpec
    • Feature
    • FeatureClassificationConfig
    • FeatureTextDetectionConfig
    • BatchAnalyzeResponse
    • AnalyzeResult
    • FeatureResult
    • TextAnnotation
    • Page
    • Block
    • Polygon
    • Vertex
    • Line
    • Polygon
    • Vertex
    • Word
    • DetectedLanguage
    • Polygon
    • Vertex
    • ClassAnnotation
    • Property
    • FaceAnnotation
    • Face
    • Polygon
    • Vertex