ocrText

Объект для хранения результатов OCR

Описание

ocrText объект содержит распознанный текст и метаданные, собранные во время оптического распознавания символов (OCR). Вы можете получить доступ к информации, содержащейся в объекте, с помощью ocrText свойства. Можно также найти текст, который совпадает с определенным шаблоном locateText функция.

Создание

Создайте ocrText использование объекта ocr функция.

Свойства

расширить все

`Text` - Текст, распознаваемый OCR
массив символов

Текст, распознаваемый OCR, задается как массив символов. Текст включает пустое место и новые символы линии.

`CharacterBoundingBoxes` - Расположение ограничивающих прямоугольников
M -by-4 матрица

Положения ограничивающего прямоугольника, сохраненные как матрица M -by-4. Каждая строка матрицы содержит вектор с четырьмя элементами, [<reservedrangesplaceholder7> <reservedrangesplaceholder6> <reservedrangesplaceholder5> <reservedrangesplaceholder4> ]. Элементы [x y] соответствуют верхнему левому углу ограничивающего прямоугольника. Элементы [width height] соответствуют размеру прямоугольной области в пикселях. Ограничительные рамки заключают текст, найденный в изображении, используяocr функция. Ширина и высота ограничивающих рамок, соответствующих новым символам линий, равны нулю. Модификаторы символов, найденные на языках, таких как хинди, тамильский и бангальский, также содержатся в ограничивающем прямоугольнике нулевой ширины и высоты.

`CharacterConfidences` - доверие в распознавании символов
массив

Доверие в распознавании символов, заданная как массив. Доверительные значения находятся в области значений [0, 1]. А доверие значение, заданное как ocr функция, должна быть интерпретирована как вероятность. ocr функция устанавливает доверительные значения для пространств между словами и устанавливает новые символы линий равными NaN. Пространства и новые символы линий не распознаются явным образом во время OCR. Можно использовать доверительные значения для определения местоположения неправильно классифицированного текста в изображении путем исключения символов с низким доверием.

`Words` - Распознанные слова
массив ячеек

Распознанные слова, заданные как массив ячеек.

`WordBoundingBoxes` - Расположение и размер ограничивающего прямоугольника
M -by-4 матрица

Расположение и размер ограничивающего прямоугольника, сохраненный как матрица M -by-4. Каждая строка матрицы содержит вектор с четырьмя элементами, [<reservedrangesplaceholder3> <reservedrangesplaceholder2> <reservedrangesplaceholder1> <reservedrangesplaceholder0>] , который определяет левый верхний угол и размер прямоугольной области в пикселях.

`WordConfidences` - Доверие к распознаванию
массив

Доверие распознавания, заданная как массив. Доверительные значения находятся в области значений [0, 1]. А доверие значение, заданное как ocr функция, должна быть интерпретирована как вероятность. ocr функция устанавливает доверительные значения для пространств между словами и устанавливает новые символы линий равными NaN. Пространства и новые символы линий не распознаются явным образом во время OCR. Можно использовать доверительные значения, чтобы идентифицировать местоположение неправильно классифицированного текста в изображении, исключив слова с низким доверием.

Функции объекта

locateText Найдите шаблон текста

Примеры

свернуть все

Поиск и подсветка текста в изображении

Открыть Live Script

businessCard = imread('businessCard.png');
ocrResults = ocr(businessCard);
bboxes = locateText(ocrResults, 'MathWorks', 'IgnoreCase', true);
Iocr = insertShape(businessCard, 'FilledRectangle', bboxes);
figure; imshow(Iocr);

Figure contains an axes. The axes contains an object of type image.

Поиск текста с использованием регулярных выражений

Открыть Live Script

     businessCard = imread('businessCard.png');
     ocrResults   = ocr(businessCard);
     bboxes = locateText(ocrResults, 'www.*com','UseRegexp', true);
     img    = insertShape(businessCard, 'FilledRectangle', bboxes);
     figure; imshow(img);

Figure contains an axes. The axes contains an object of type image.

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Указания и ограничения по применению:

Использование в блоке MATLAB Function не поддерживается.
The Words невозможно получить доступ к свойству при генерации кода. Используйте Text свойство вместо Words свойство для доступа к результатам OCR.

См. также

insertShape | ocr | OCR Trainer | regexp | strfind

Введенный в R2014a

Документация

ocrText

Описание

Создание

Свойства

`Text` - Текст, распознаваемый OCR
массив символов

`CharacterBoundingBoxes` - Расположение ограничивающих прямоугольников
M -by-4 матрица

`CharacterConfidences` - доверие в распознавании символов
массив

`Words` - Распознанные слова
массив ячеек

`WordBoundingBoxes` - Расположение и размер ограничивающего прямоугольника
M -by-4 матрица

`WordConfidences` - Доверие к распознаванию
массив

Функции объекта

Примеры

Поиск и подсветка текста в изображении

Поиск текста с использованием регулярных выражений

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

См. также

Документация по Computer Vision Toolbox

Поддержка

Документация

ocrText

Описание

Создание

Свойства

Text - Текст, распознаваемый OCR массив символов

CharacterBoundingBoxes - Расположение ограничивающих прямоугольников M -by-4 матрица

CharacterConfidences - доверие в распознавании символов массив

Words - Распознанные слова массив ячеек

WordBoundingBoxes - Расположение и размер ограничивающего прямоугольника M -by-4 матрица

WordConfidences - Доверие к распознаванию массив

Функции объекта

Примеры

Поиск и подсветка текста в изображении

Поиск текста с использованием регулярных выражений

Расширенные возможности

Генерация кода C/C + + Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

См. также

Документация по Computer Vision Toolbox

Поддержка

`Text` - Текст, распознаваемый OCR
массив символов

`CharacterBoundingBoxes` - Расположение ограничивающих прямоугольников
M -by-4 матрица

`CharacterConfidences` - доверие в распознавании символов
массив

`Words` - Распознанные слова
массив ячеек

`WordBoundingBoxes` - Расположение и размер ограничивающего прямоугольника
M -by-4 матрица

`WordConfidences` - Доверие к распознаванию
массив

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®