Обучите оптическое распознавание символов пользовательским шрифтам

Приложение оптического распознавания символов (OCR) обучает функцию ocr распознавать пользовательский язык или шрифт. Можно использовать это приложение, чтобы маркировать символьные данные в интерактивном режиме для обучения OCR и сгенерировать файл данных языка OCR для использования с функцией ocr.

Откройте приложение OCR Trainer

  • MATLAB® Toolstrip: На вкладке Apps, под Image Processing and Computer Vision, нажатием кнопки, значком приложения OCR.

  • Подсказка команды MATLAB: Введите ocrTrainer.

Обучите OCR

  1. В OCR Trainer нажмите New Session, чтобы открыть диалоговое окно OCR Training Session Settings.

  2. Под Output Settings введите имя для файла данных языка OCR и выберите выходное местоположение папки для файла. Местоположение, которое вы задаете, должно быть перезаписываемо.

  3. Под Labeling Method или маркируйте данные вручную или предварительно маркируйте его с помощью оптического распознавания символов. Если вы используете OCR, можно выбрать или предварительно установленный английский или японский язык, или можно загрузить дополнительные файлы поддержки языка.

    Примечание

    Чтобы загрузить файл поддержки языка, введите visionSupportPackages в Окне Команды MATLAB. Также на вкладке MATLAB Home, в разделе Environment, нажимают Add-Ons> Get Add-Ons. Затем используйте поле поиска, чтобы найти “Данные о Языке OCR Computer Vision System Toolbox”.

  4. Добавьте изображения в любое время во время сеанса обучения. Преподаватель автоматически сегментирует изображения для обучения OCR. Осмотрите результаты проверить ожидаемую текстовую сегментацию. Чтобы улучшить сегментацию, предварительно обработайте свои изображения с помощью приложения Image Segmenter. Если изображения добавляются, можно осмотреть сегментацию, следует из учебного представления изображения.

    Чтобы ограничить OCR определенным набором символов, установите флажок Character set и добавьте символы.

    Примечание

    Используйте учебные изображения, которые содержат текст, который вы хотите, чтобы OCR распознал. Не используйте учебные изображения только с несколькими символами. Обучение OCR работает лучше всего, если учебные изображения содержат блоки многих слов. Можно использовать функцию insertText, чтобы автоматически сгенерировать учебные изображения для известного шрифта.

    I = zeros(500,500,3,'uint8');
    
    textLines = [
        "some training text"
        "even more stuff to learn"
        ]
    lineYLocation = 50;
    
    for i = 1:numel(textLines)
        I = insertText(I,[50 lineYLocation],char(textLines(i)), ...
            'Font','LucidaSansRegular',...
            'FontSize',16,'TextColor','white',...
            'BoxOpacity',0);
    
     % increment to next line
        lineYLocation = lineYLocation + 20;
    end
    figure
    imshow(I) 
  5. Удалите любые шумные изображения. Чтобы улучшить результаты сегментации, можно чертить видимую область, чтобы выбрать фрагмент изображения. Отображение показывает оригинальное изображение слева и отредактированное справа. Когда вы будете сделаны, нажмите Accept All.

  6. Измените извлеченные выборки из символьного окна представления.

    • Чтобы исправить выборки, выберите группу выборок от Data Browser, разделяют на области и изменяют метки с помощью поля Character Label.

    • Чтобы исключить выборку из обучения, щелкните правой кнопкой по выборке и выберите опцию, чтобы переместить ту выборку в категорию Unknown. Неизвестные выборки перечислены наверху Data Browser, разделяют на области и не используются для обучения.

    • Если ограничительная рамка отсекла символ, дважды кликните символ и измените его в изображении, от которого он был извлечен.

  7. После исправления выборок нажмите Train. Когда преподаватель завершает обучение, приложение создает файл данных языка OCR и сохраняет его в папку, которую вы задали.

Управления приложениями

Сеансы

Запускает новый сеанс, открывает сохраненный сеанс или добавляет сеанс в текущий. Можно также сохранить и назвать сеанс. Сеансы сохранены как файлы MAT.

Добавьте изображения

Добавляют изображения. Можно добавить изображения, когда вы запускаете новый сеанс или после того, как вы принимаете текущий набор изображений.

Настройки

Установите или измените отображение шрифта.

Окно редактирования

Выбирает изображение, которое содержит выделенный символ, наряду с ограничительными рамками. Можно создать дополнительные области, объединить, изменить или удалить существующие изображения. Чтобы удалить ROI, используйте ключ delete.

Train

Создает файл данных OCR из сеанса. Чтобы использовать файл .traineddata с функцией ocr, установите свойство 'Language' для функции ocr и следуйте за направлениями для пользовательского языка.

Сгенерируйте функцию

Создает автоматически сгенерированную функцию оценки для верификации учебных результатов.

Смотрите также

|