Ограничения в текущей версии распознавания текста
Статья создана
Обновлена 23 ноября 2023 г.
Сейчас сервис работает с ограничениями. Ознакомьтесь с ними, прежде чем начать работать:
- Достоверность распознавания (
confidence
) считается только для строки (line
). Для слова и для распознанного языка используется значение из строки. - Для всех распознанных слов указывается один язык, хотя слова распознаются на всех языках из использованной модели. Например, если указать
["en", "ar"]
и английских слов в тексте больше, то все слова могут быть помечены языкомen
, в том числе слова на арабском. - Плохо распознается:
- художественные шрифты;
- вертикальный текст (когда слово пишется сверху вниз);
- анкеты, где каждый символ пишется в отдельной ячейке;
- очень крупный текст, например, когда одно слово занимает половину изображения.