Приложение оптического распознавания символов (OCR) обучает ocr
функция для распознавания пользовательского языка или шрифта. Вы можете использовать это приложение для маркировки символьных данных в интерактивном режиме для обучения OCR и для генерации файла данных на языке OCR для использования с ocr
функция.
MATLAB® Панель инструментов: На вкладке Apps, в разделе Image Processing and Computer Vision, нажмите, значок приложения OCR.
Командная строка MATLAB: Ввод ocrTrainer
.
В окне OCR Trainer щелкните New Session, чтобы открыть диалоговое окно OCR Training Session Settings.
В разделе Output Settings введите имя файла данных на языке OCR и выберите расположение выходной папки для файла. Указанное местоположение должно быть доступным для записи.
В разделе Labeling Method либо пометьте данные вручную, либо предварительно пометьте их с помощью оптического распознавания символов. При использовании OCR можно выбрать либо предустановленный английский, либо японский язык, либо загрузить дополнительные файлы языковой поддержки.
Примечание
Чтобы загрузить файл поддержки языка, введите visionSupportPackages
в Командном Окне MATLAB. Кроме того, на вкладке Home MATLAB, в разделе Environment, нажмите Add-Ons > Get Add-Ons. Затем используйте поле поиска, чтобы найти «Computer Vision System Toolbox OCR Language Data».
Добавляйте изображения в любое время во время сеанса обучения. Тренер автоматически сегментирует изображения для обучения OCR. Смотрите результаты, чтобы проверить ожидаемую сегментацию текста. Чтобы улучшить сегментацию, предварительно обработайте изображения с помощью Image Segmenter приложения. После добавления изображений можно просмотреть результаты сегментации из представления обучающего изображения.
Чтобы ограничить OCR определенным набором символов, установите флажок Character set и добавьте символы.
Примечание
Используйте обучающие изображения, которые содержат текст, который вы хотите распознать OCR. Не используйте обучающие изображения только с несколькими символами. OCR-обучение работает лучше всего, если обучающие изображения содержат блоки многих слов. Вы можете использовать insertText
функция для автоматической генерации обучающих изображений для известного шрифта.
I = zeros(500,500,3,'uint8'); textLines = [ "some training text" "even more stuff to learn" ] lineYLocation = 50; for i = 1:numel(textLines) I = insertText(I,[50 lineYLocation],char(textLines(i)), ... 'Font','LucidaSansRegular',... 'FontSize',16,'TextColor','white',... 'BoxOpacity',0); % increment to next line lineYLocation = lineYLocation + 20; end figure imshow(I)
Удалите любые шумные изображения. Чтобы улучшить результаты сегментации, можно нарисовать необходимую область, чтобы выбрать фрагмент изображения. На отображение показаны оригинальные изображения слева и отредактированный справа. Когда вы закончите, нажмите Accept All.
Измените извлечённые выборки из окна представления символов.
Чтобы исправить выборки, выберите группу выборок в окне представления символов и измените метки с помощью поля Character Label.
Чтобы исключить выборку из обучения, щелкните правой кнопкой мыши выборку и выберите опцию, чтобы переместить эту выборку в категорию Unknown. Неизвестные выборки перечислены в верхней части окна браузера данных и не используются для обучения.
Если ограничивающий прямоугольник обрезал символ, дважды кликните его и измените на изображении, из которого он был извлечен.
После корректировки выборок нажмите Train. Когда тренер завершает обучение, приложение создает файл данных на языке OCR и сохраняет его в указанной папке.
Запускает новый сеанс, открывает сохраненный сеанс или добавляет сеанс к текущему. Можно также сохранить и назвать сеанс. Сеансы сохраняются как файлы MAT.
Добавляет изображения. Можно добавлять изображения при запуске нового сеанса или после принятия текущего набора изображений.
Установите или измените отображение шрифта.
Выбор изображения, содержащего выбранный символ, вместе с ограничивающими рамками. Можно создавать дополнительные области, объединять, изменять или удалять существующие изображения. Чтобы удалить информация только для чтения, используйте ключ delete.
Создает файл данных OCR из сеанса. Как использовать .traineddata
файла с ocr
function, установите 'Language'
свойство для ocr
и следуйте инструкциям для пользовательского языка.
Создает автогенерированную функцию оценки для верификации результатов обучения.
Примечание
Перед запуском приложения OCR Trainer проверьте, есть ли у вашей машины только одна установка Tesseract. Если существует несколько установок Tesseract, удалите дополнительные установки и перезапустите MATLAB, чтобы запустить приложение OCR Trainer. В противном случае приложение возвращает ошибку «Недостаточно входных параметров» при нажатии кнопки Train.