ocrText

Объект для хранения результатов OCR

Описание

ocrText объект содержит распознанный текст и метаданные, собранные во время оптического распознавания символов (OCR). Вы можете получить доступ к информации, содержащейся в объекте, с помощью ocrText свойства. Можно также найти текст, который совпадает с определенным шаблоном locateText функция.

Создание

Создайте ocrText использование объекта ocr функция.

Свойства

расширить все

Текст, распознаваемый OCR, задается как массив символов. Текст включает пустое место и новые символы линии.

Положения ограничивающего прямоугольника, сохраненные как матрица M -by-4. Каждая строка матрицы содержит вектор с четырьмя элементами, [<reservedrangesplaceholder7> <reservedrangesplaceholder6> <reservedrangesplaceholder5> <reservedrangesplaceholder4> ]. Элементы [x y] соответствуют верхнему левому углу ограничивающего прямоугольника. Элементы [width height] соответствуют размеру прямоугольной области в пикселях. Ограничительные рамки заключают текст, найденный в изображении, используяocr функция. Ширина и высота ограничивающих рамок, соответствующих новым символам линий, равны нулю. Модификаторы символов, найденные на языках, таких как хинди, тамильский и бангальский, также содержатся в ограничивающем прямоугольнике нулевой ширины и высоты.

Доверие в распознавании символов, заданная как массив. Доверительные значения находятся в области значений [0, 1]. А доверие значение, заданное как ocr функция, должна быть интерпретирована как вероятность. ocr функция устанавливает доверительные значения для пространств между словами и устанавливает новые символы линий равными NaN. Пространства и новые символы линий не распознаются явным образом во время OCR. Можно использовать доверительные значения для определения местоположения неправильно классифицированного текста в изображении путем исключения символов с низким доверием.

Распознанные слова, заданные как массив ячеек.

Расположение и размер ограничивающего прямоугольника, сохраненный как матрица M -by-4. Каждая строка матрицы содержит вектор с четырьмя элементами, [<reservedrangesplaceholder3> <reservedrangesplaceholder2> <reservedrangesplaceholder1> <reservedrangesplaceholder0>] , который определяет левый верхний угол и размер прямоугольной области в пикселях.

Доверие распознавания, заданная как массив. Доверительные значения находятся в области значений [0, 1]. А доверие значение, заданное как ocr функция, должна быть интерпретирована как вероятность. ocr функция устанавливает доверительные значения для пространств между словами и устанавливает новые символы линий равными NaN. Пространства и новые символы линий не распознаются явным образом во время OCR. Можно использовать доверительные значения, чтобы идентифицировать местоположение неправильно классифицированного текста в изображении, исключив слова с низким доверием.

Функции объекта

locateTextНайдите шаблон текста

Примеры

свернуть все

businessCard = imread('businessCard.png');
ocrResults = ocr(businessCard);
bboxes = locateText(ocrResults, 'MathWorks', 'IgnoreCase', true);
Iocr = insertShape(businessCard, 'FilledRectangle', bboxes);
figure; imshow(Iocr);

Figure contains an axes. The axes contains an object of type image.

     businessCard = imread('businessCard.png');
     ocrResults   = ocr(businessCard);
     bboxes = locateText(ocrResults, 'www.*com','UseRegexp', true);
     img    = insertShape(businessCard, 'FilledRectangle', bboxes);
     figure; imshow(img);

Figure contains an axes. The axes contains an object of type image.

Расширенные возможности

.

См. также

| | | |

Введенный в R2014a