Yandex Vision

Сервис компьютерного зрения для анализа изображений.

Поддержка 40+ языков
Сервис работает с разными языковыми моделями. В их числе латино-кириллическая модель с поддержкой более 40 языков.
Простая интеграция
Сервис предоставляет REST и gRPC API, которые можно использовать для интеграции с вашими приложениями.
Высокая скорость обработки
Одна страница текста распознается за пару секунд. В одном запросе вы можете отправить сразу несколько изображений с текстами на одном или нескольких языках.
Классификация изображений
Preview
Технология классификации изображений помогает анализировать контент, который загружают ваши пользователи. Например, вы можете фильтровать контент для взрослых или отбирать только изображения высокого качества.
Распознавание текста
Vision распознаёт текст на изображении, указывает его расположение и возвращает в виде блоков текста, строк и слов с автоматической расстановкой знаков препинания.
Обнаружение лиц
Preview
Обнаружение лиц автоматически находит фотографии с портретами среди всех изображений, помогает отметить людей на фотографии.
Распознавание автомобильных номеров
Сервис распознаёт автомобильные номера на фотографиях, а также шаблоны документов (например, паспорта).

Решайте свои задачи с Vision

Поиск текста по архивам отсканированных документов

Если вам нужно найти определённую информацию по архиву отсканированных документов, сохранённых только в виде изображений, Vision поможет распознать текст и сделает его доступным для индексации и поиска.

Автоматический перевод текстов на изображениях

Распознавайте тексты на изображениях и сразу переводите их на другие языки с помощью сервисов Vision и Translate. Чтобы встроить эту функцию в свои приложения, воспользуйтесь REST или gRPC API, которые предоставляют оба сервиса.
Работает в связке с
Translate

Автоматизация бизнес-процессов

Используйте Vision для автоматизации процессов, в которых нужно сканировать и распознавать тексты однотипных документов и заносить их в систему документооборота. Сервис распознает текст и проанализирует, в какой части документа он должен быть размещён.
Модерация детского контента — очень чувствительная и непростая тема. Решение, использующее современные технологии Yandex.Cloud, ускоряет обработку контента и существенно снижает репутационные риски.
Михаил Ярцев,
директор по маркетингу торговой сети «Пятёрочка»
Читать историю

Вопросы и ответы

Какие типы анализа поддерживает Vision?

Vision поддерживает следующие возможности: оптическое распознавание текста (OCR), распознавание документов, автомобильных номеров, обнаружение лиц и классификация изображений.

Vision поддерживает следующие возможности: оптическое распознавание текста (OCR), распознавание документов, автомобильных номеров, обнаружение лиц и классификация изображений.

Какие модели используются для классификации?

Для классификации изображений в сервисе используется модель, обученная на определённом наборе изображений. Сейчас поддерживаются модели:

  • quality — оценивает качество изображения;
  • moderation — оценивает соответствие признакам, используемым при модерации изображений.

Для классификации изображений в сервисе используется модель, обученная на определённом наборе изображений. Сейчас поддерживаются модели:

  • quality — оценивает качество изображения;
  • moderation — оценивает соответствие признакам, используемым при модерации изображений.

Какие форматы файлов поддерживаются Vision?

Vision позволяет работать с файлами форматов JPEG, PNG и PDF.

Vision позволяет работать с файлами форматов JPEG, PNG и PDF.

Начните пользоваться Vision