exponenta event banner

ocrText

Объект для хранения результатов OCR

Описание

ocrText объект содержит распознанный текст и метаданные, собранные во время оптического распознавания символов (OCR). Доступ к информации, содержащейся в объекте, можно получить с помощью ocrText свойства. Можно также найти текст, соответствующий определенному образцу, с помощью locateText функция.

Создание

Создание ocrText с использованием ocr функция.

Свойства

развернуть все

Распознаваемый OCR текст, указанный как массив символов. Текст содержит пробелы и новые символы строк.

Расположение ограничивающей рамки, хранящееся в виде матрицы M-by-4. Каждая строка матрицы содержит четырехэлементный вектор, [x y width height ]. Элементы [x y] соответствуют верхнему левому углу ограничивающей рамки. Элементы [width height] соответствуют размеру прямоугольной области в пикселях. Ограничивающие рамки заключают текст, найденный на изображении с помощью ocr функция. Ширина и высота ограничивающих прямоугольников, соответствующих новым символам линии, устанавливаются равными нулю. Модификаторы символов, встречающиеся в таких языках, как хинди, тамильский и бангалский, также содержатся в ограничительной рамке нулевой ширины и высоты.

Достоверность распознавания символов, заданная как массив. Доверительные значения находятся в диапазоне [0, 1]. Доверительное значение, установленное ocr функция должна интерпретироваться как вероятность. ocr функция устанавливает доверительные значения для пробелов между словами и устанавливает новые символы строки на NaN. Пробелы и новые символы строк не распознаются явно во время OCR. Можно использовать доверительные значения для определения местоположения неверно классифицированного текста в изображении путем исключения символов с низкой степенью достоверности.

Распознаваемые слова, указанные как массив ячеек.

Расположение и размер ограничивающей рамки, хранящиеся в виде матрицы M-by-4. Каждая строка матрицы содержит четырехэлементный вектор [x y width height ], указывающий левый верхний угол и размер прямоугольной области в пикселях.

Уверенность в распознавании, заданная как массив. Доверительные значения находятся в диапазоне [0, 1]. Доверительное значение, установленное ocr функция должна интерпретироваться как вероятность. ocr функция устанавливает доверительные значения для пробелов между словами и устанавливает новые символы строки на NaN. Пробелы и новые символы строк не распознаются явно во время OCR. Можно использовать доверительные значения для определения местоположения неверно классифицированного текста в изображении путем исключения слов с низкой степенью достоверности.

Функции объекта

locateTextПоиск текстового шаблона

Примеры

свернуть все

businessCard = imread('businessCard.png');
ocrResults = ocr(businessCard);
bboxes = locateText(ocrResults, 'MathWorks', 'IgnoreCase', true);
Iocr = insertShape(businessCard, 'FilledRectangle', bboxes);
figure; imshow(Iocr);

Figure contains an axes. The axes contains an object of type image.

     businessCard = imread('businessCard.png');
     ocrResults   = ocr(businessCard);
     bboxes = locateText(ocrResults, 'www.*com','UseRegexp', true);
     img    = insertShape(businessCard, 'FilledRectangle', bboxes);
     figure; imshow(img);

Figure contains an axes. The axes contains an object of type image.

Расширенные возможности

.
Представлен в R2014a