класс ocrText

Объект для хранения результатов OCR

Описание

ocrText содержит распознанный текст и метаданные, собранные во время оптического распознавания символов (OCR). Функция ocr возвращает объект ocrText. Можно получить доступ к информации, содержавшейся в объекте со свойствами ocrText. Можно также определить местоположение текста, который совпадает с определенным шаблоном методу locateText объекта.

Свойства

развернуть все

Текст распознан OCR, заданным как массив символов. Текст включает пробельные символы и символы новой строки.

Местоположения ограничительной рамки, сохраненные как M-by-4 матрица. Каждая строка матрицы содержит четырехэлементный вектор, [x y width height]. [x y] элементы соответствуют верхнему левому углу ограничительной рамки. [width height] элементы соответствуют размеру прямоугольной области в пикселях. Ограничительные рамки заключают текст, найденный в изображение с помощью функции ocr. Ширина ограничительных рамок и высота, которые соответствуют символам новой строки, обнуляются. Символьные модификаторы, найденные на языках, таких как хинди, тамильский, и Bangalese, также содержатся в ограничительной рамке нулевой ширины и высоты.

Уверенность распознавания символов, заданная как массив. Значения уверенности находятся в области значений [0, 1]. Значение уверенности, установленное функцией ocr, должно быть интерпретировано как вероятность. Функция ocr устанавливает значения уверенности для пробелов между словами и устанавливает символы новой строки на NaN. Пробелы и символы новой строки явным образом не распознаны во время OCR. Можно использовать значения уверенности, чтобы идентифицировать местоположение неправильно классифицированного текста в изображении путем устранения символов с низкой уверенностью.

Распознанные слова, заданные как массив ячеек.

Местоположение ограничительной рамки и размер, сохраненный как M-by-4 матрица. Каждая строка матрицы содержит четырехэлементный вектор, [x y width height], который задает левый верхний угол и размер прямоугольной области в пикселях.

Уверенность распознавания, заданная как массив. Значения уверенности находятся в области значений [0, 1]. Значение уверенности, установленное функцией ocr, должно быть интерпретировано как вероятность. Функция ocr устанавливает значения уверенности для пробелов между словами и устанавливает символы новой строки на NaN. Пробелы и символы новой строки явным образом не распознаны во время OCR. Можно использовать значения уверенности, чтобы идентифицировать местоположение неправильно классифицированного текста в изображении путем устранения слов с низкой уверенностью.

Методы

locateTextНайдите текстовый шаблон

Примеры

свернуть все

businessCard = imread('businessCard.png');
ocrResults = ocr(businessCard);
bboxes = locateText(ocrResults, 'MathWorks', 'IgnoreCase', true);
Iocr = insertShape(businessCard, 'FilledRectangle', bboxes);
figure; imshow(Iocr);

     businessCard = imread('businessCard.png');
     ocrResults   = ocr(businessCard);
     bboxes = locateText(ocrResults, 'www.*com','UseRegexp', true);
     img    = insertShape(businessCard, 'FilledRectangle', bboxes);
     figure; imshow(img);

Расширенные возможности

Смотрите также

| | |

Введенный в R2014a

Для просмотра документации необходимо авторизоваться на сайте