Yandex.Cloud
  • Сервисы
  • Почему Yandex.Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Yandex Vision
  • Начало работы
  • Пошаговые инструкции
    • Все инструкции
    • Распознавание текста
    • Определение качества изображения
    • Модерирование изображений
    • Обнаружение лиц
    • Кодирование в Base64
  • Концепции
    • Обзор
    • Распознавание текста
      • Обзор
      • Распознавание шаблонов
      • Поддерживаемые языки
      • Ограничения в текущей версии
    • Классификация изображений
      • Обзор
      • Поддерживаемые модели
    • Обнаружение лиц
    • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Справочник API
    • Аутентификация в API
    • gRPC
      • Обзор
      • VisionService
    • REST
      • Обработка ошибок
      • Диагностика ошибок
      • Обзор
      • Vision
        • Обзор
        • batchAnalyze
  • Вопросы и ответы
  1. Концепции
  2. Обзор

О сервисе компьютерного зрения

  • Возможности для анализа
  • Формат тела запроса
  • Ответ сервиса

Сервис компьютерного зрения Yandex Vision анализирует переданное изображение и возвращает вам результат.

Возможности для анализа

Возможности — это различные типы анализа, которые позволяет выполнять сервис. Например:

  • распознавание текста;
  • обнаружение лиц;
  • классификация изображений.

Формат тела запроса

Тело запроса состоит из спецификаций (analyzeSpecs). В каждой спецификации вы передаете файл с изображением (content) и список возможностей (features), которые необходимо применить.

Например, чтобы попросить сервис обнаружить лица и распознать текст на изображении, тело запроса будет выглядеть так:

{
    "folderId": "b1gvmob95yysaplct532",
    "analyze_specs": [{
        "content": "iVBORw0KGgo...",
        "features": [{
            "type": "FACE_DETECTION"
        },
        {
            "type": "TEXT_DETECTION",
            "text_detection_config": {
                "language_codes": ["ru", "en"]
            }
        }]
    }]
}

В запросе можно передать до 8 спецификаций и использовать до 8 возможностей в каждой спецификации. Если вам надо использовать больше 8 возможностей для одного изображения, передайте его дважды в разных спецификациях.

Ответ сервиса

Сервис возвращает массив результатов анализа для каждой из переданных спецификаций. Каждый элемент массива - это тоже массив результатов для каждой из запрошенных возможностей:

{
  "results": [{
    // Результаты для первой спецификации.
    "results": [{
        // Результаты для первой запрошенной возможности — обнаружение лиц.
        "faceDetection": { ... }
      },
      {
        // Результаты для второй запрошенной возможности — распознавание текста.
        "textDetection": { ... }
      }
    ]
  }]
}

Результаты в ответе сервиса возвращаются в том же порядке, в котором они были указаны в запросе. Если вы передали 2 спецификации: в первой изображение с котиками, а во второй — с собаками, то первым элементом в массиве будет результат для изображения с котиками.

Результаты для каждой запрошенной возможности также возвращаются

Если в процессе какого-то из анализов произошла ошибка, она будет возвращена вместо соответствующего результата. Подробнее об обработке ошибок.

Что дальше

  • Как работает распознавание текста
  • Как работает обнаружение лиц
  • Как работает классификация изображений
В этой статье:
  • Возможности для анализа
  • Формат тела запроса
  • Ответ сервиса
Language
Вакансии
Политика конфиденциальности
Условия использования
© 2021 ООО «Яндекс.Облако»