Объект для хранения результатов OCR
ocrText
объект содержит распознанный текст и метаданные, собранные во время оптического распознавания символов (OCR). Вы можете получить доступ к информации, содержащейся в объекте, с помощью ocrText
свойства. Можно также найти текст, который совпадает с определенным шаблоном locateText
функция.
Создайте ocrText
использование объекта ocr
функция.
Text
- Текст, распознаваемый OCRТекст, распознаваемый OCR, задается как массив символов. Текст включает пустое место и новые символы линии.
CharacterBoundingBoxes
- Расположение ограничивающих прямоугольниковПоложения ограничивающего прямоугольника, сохраненные как матрица M -by-4. Каждая строка матрицы содержит вектор с четырьмя элементами, [<reservedrangesplaceholder7> <reservedrangesplaceholder6> <reservedrangesplaceholder5> <reservedrangesplaceholder4>
]. Элементы [x y] соответствуют
верхнему левому углу ограничивающего прямоугольника. Элементы [width height] соответствуют размеру прямоугольной области в пикселях. Ограничительные рамки заключают текст, найденный в изображении, используяocr
функция. Ширина и высота ограничивающих рамок, соответствующих новым символам линий, равны нулю. Модификаторы символов, найденные на языках, таких как хинди, тамильский и бангальский, также содержатся в ограничивающем прямоугольнике нулевой ширины и высоты.
CharacterConfidences
- доверие в распознавании символовДоверие в распознавании символов, заданная как массив. Доверительные значения находятся в области значений [0, 1]. А доверие значение, заданное как ocr
функция, должна быть интерпретирована как вероятность. ocr
функция устанавливает доверительные значения для пространств между словами и устанавливает новые символы линий равными NaN
. Пространства и новые символы линий не распознаются явным образом во время OCR. Можно использовать доверительные значения для определения местоположения неправильно классифицированного текста в изображении путем исключения символов с низким доверием.
Words
- Распознанные словаРаспознанные слова, заданные как массив ячеек.
WordBoundingBoxes
- Расположение и размер ограничивающего прямоугольникаРасположение и размер ограничивающего прямоугольника, сохраненный как матрица M -by-4. Каждая строка матрицы содержит вектор с четырьмя элементами, [<reservedrangesplaceholder3> <reservedrangesplaceholder2> <reservedrangesplaceholder1> <reservedrangesplaceholder0>] , который определяет левый верхний угол и размер прямоугольной области в пикселях.
WordConfidences
- Доверие к распознаваниюДоверие распознавания, заданная как массив. Доверительные значения находятся в области значений [0, 1]. А доверие значение, заданное как ocr
функция, должна быть интерпретирована как вероятность. ocr
функция устанавливает доверительные значения для пространств между словами и устанавливает новые символы линий равными NaN
. Пространства и новые символы линий не распознаются явным образом во время OCR. Можно использовать доверительные значения, чтобы идентифицировать местоположение неправильно классифицированного текста в изображении, исключив слова с низким доверием.
locateText | Найдите шаблон текста |
businessCard = imread('businessCard.png'); ocrResults = ocr(businessCard); bboxes = locateText(ocrResults, 'MathWorks', 'IgnoreCase', true); Iocr = insertShape(businessCard, 'FilledRectangle', bboxes); figure; imshow(Iocr);
businessCard = imread('businessCard.png'); ocrResults = ocr(businessCard); bboxes = locateText(ocrResults, 'www.*com','UseRegexp', true); img = insertShape(businessCard, 'FilledRectangle', bboxes); figure; imshow(img);
Указания и ограничения по применению:
Использование в блоке MATLAB Function не поддерживается.
The Words
невозможно получить доступ к свойству при генерации кода. Используйте Text
свойство вместо Words
свойство для доступа к результатам OCR.
insertShape
| ocr
| OCR Trainer | regexp
| strfind
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.