Обучите оптическое распознавание символов для пользовательских шрифтов

Приложение оптического распознавания символов (OCR) обучает ocr функция для распознавания пользовательского языка или шрифта. Вы можете использовать это приложение для маркировки символьных данных в интерактивном режиме для обучения OCR и для генерации файла данных на языке OCR для использования с ocr функция.

Откройте приложение OCR Trainer

  • MATLAB® Панель инструментов: На вкладке Apps, в разделе Image Processing and Computer Vision, нажмите, значок приложения OCR.

  • Командная строка MATLAB: Ввод ocrTrainer.

Train OCR

  1. В окне OCR Trainer щелкните New Session, чтобы открыть диалоговое окно OCR Training Session Settings.

  2. В разделе Output Settings введите имя файла данных на языке OCR и выберите расположение выходной папки для файла. Указанное местоположение должно быть доступным для записи.

  3. В разделе Labeling Method либо пометьте данные вручную, либо предварительно пометьте их с помощью оптического распознавания символов. При использовании OCR можно выбрать либо предустановленный английский, либо японский язык, либо загрузить дополнительные файлы языковой поддержки.

    Примечание

    Чтобы загрузить файл поддержки языка, введите visionSupportPackages в Командном Окне MATLAB. Кроме того, на вкладке Home MATLAB, в разделе Environment, нажмите Add-Ons > Get Add-Ons. Затем используйте поле поиска, чтобы найти «Computer Vision System Toolbox OCR Language Data».

  4. Добавляйте изображения в любое время во время сеанса обучения. Тренер автоматически сегментирует изображения для обучения OCR. Смотрите результаты, чтобы проверить ожидаемую сегментацию текста. Чтобы улучшить сегментацию, предварительно обработайте изображения с помощью Image Segmenter приложения. После добавления изображений можно просмотреть результаты сегментации из представления обучающего изображения.

    Чтобы ограничить OCR определенным набором символов, установите флажок Character set и добавьте символы.

    Примечание

    Используйте обучающие изображения, которые содержат текст, который вы хотите распознать OCR. Не используйте обучающие изображения только с несколькими символами. OCR-обучение работает лучше всего, если обучающие изображения содержат блоки многих слов. Вы можете использовать insertText функция для автоматической генерации обучающих изображений для известного шрифта.

    I = zeros(500,500,3,'uint8');
    
    textLines = [
        "some training text"
        "even more stuff to learn"
        ]
    lineYLocation = 50;
    
    for i = 1:numel(textLines)
        I = insertText(I,[50 lineYLocation],char(textLines(i)), ...
            'Font','LucidaSansRegular',...
            'FontSize',16,'TextColor','white',...
            'BoxOpacity',0);
    
     % increment to next line
        lineYLocation = lineYLocation + 20;
    end
    figure
    imshow(I) 
  5. Удалите любые шумные изображения. Чтобы улучшить результаты сегментации, можно нарисовать необходимую область, чтобы выбрать фрагмент изображения. На отображение показаны оригинальные изображения слева и отредактированный справа. Когда вы закончите, нажмите Accept All.

  6. Измените извлечённые выборки из окна представления символов.

    • Чтобы исправить выборки, выберите группу выборок в окне представления символов и измените метки с помощью поля Character Label.

    • Чтобы исключить выборку из обучения, щелкните правой кнопкой мыши выборку и выберите опцию, чтобы переместить эту выборку в категорию Unknown. Неизвестные выборки перечислены в верхней части окна браузера данных и не используются для обучения.

    • Если ограничивающий прямоугольник обрезал символ, дважды кликните его и измените на изображении, из которого он был извлечен.

  7. После корректировки выборок нажмите Train. Когда тренер завершает обучение, приложение создает файл данных на языке OCR и сохраняет его в указанной папке.

Управление приложениями

Сеансы

Запускает новый сеанс, открывает сохраненный сеанс или добавляет сеанс к текущему. Можно также сохранить и назвать сеанс. Сеансы сохраняются как файлы MAT.

Добавление изображений

Добавляет изображения. Можно добавлять изображения при запуске нового сеанса или после принятия текущего набора изображений.

Настройки

Установите или измените отображение шрифта.

Поле редактирования

Выбор изображения, содержащего выбранный символ, вместе с ограничивающими рамками. Можно создавать дополнительные области, объединять, изменять или удалять существующие изображения. Чтобы удалить информация только для чтения, используйте ключ delete.

Train

Создает файл данных OCR из сеанса. Как использовать .traineddata файла с ocr function, установите 'Language' свойство для ocr и следуйте инструкциям для пользовательского языка.

Сгенерируйте функцию

Создает автогенерированную функцию оценки для верификации результатов обучения.

Примечание

Перед запуском приложения OCR Trainer проверьте, есть ли у вашей машины только одна установка Tesseract. Если существует несколько установок Tesseract, удалите дополнительные установки и перезапустите MATLAB, чтобы запустить приложение OCR Trainer. В противном случае приложение возвращает ошибку «Недостаточно входных параметров» при нажатии кнопки Train.

См. также

|