Предварительная обработка данных для специфичных для домена применений глубокого обучения

Предварительная обработка данных используется для обучения, валидации и вывода. Предварительная обработка состоит из ряда детерминированных операций, которые нормализуют или улучшают желаемые функции данных. Для примера можно нормализовать данные до фиксированной области значений или перерассчитать данные до размера, требуемого слоем сетевого входа.

Предварительная обработка может происходить на двух этапах рабочего процесса глубокого обучения.

Обычно предварительная обработка происходит как отдельный шаг, который вы завершаете перед подготовкой данных, которые будут переданы в сеть. Вы загружаете свои исходные данные, применяете операции предварительной обработки, а затем сохраняете результат на диск. Преимущество этого подхода заключается в том, что накладные расходы на предварительную обработку требуются только один раз, тогда предварительно обработанные изображения легко доступны в качестве отправного места для всех будущих испытаний по обучению сети.
Если вы загружаете свои данные в datastore, то можно также применить предварительную обработку во время обучения с помощью transform и combine функций. Для получения дополнительной информации смотрите Datastores для глубокого обучения. Преобразованные изображения не хранятся в памяти. Этот подход удобен, чтобы избежать записи второй копии обучающих данных на диск, если ваши операции предварительной обработки не являются вычислительно дорогими и не оказывают заметного влияния на скорость обучения сети.

Увеличение количества данных состоит из рандомизированных операций, которые применяются к обучающим данным во время обучения сети. Увеличение увеличивает эффективный объем обучающих данных и помогает сделать сеть инвариантной общим искажениям в данных. Например, можно добавить искусственный шум к обучающим данным, чтобы сеть была инвариантна для шума.

Чтобы увеличить обучающие данные, начните с загрузки данных в datastore. Для получения дополнительной информации смотрите Datastores для глубокого обучения. Некоторые встроенные хранилища данных применяют определенный и ограниченный набор увеличения к данным для конкретных приложений. Можно также применить свой собственный набор операций увеличения к данным в datastore при помощи transform и combine функций. Во время обучения datastore случайным образом возмущает обучающие данные для каждой эпохи, так что каждая эпоха использует немного другой набор данных.

Приложения обработки изображений

Увеличение данных изображения, чтобы симулировать изменения в сборе изображения. Для примера наиболее распространенным типом операций увеличения изображения являются геометрические преобразования, такие как поворот и перемещение, которые моделируют изменения ориентации камеры относительно сцены. Color jitter моделирует изменения условий подсветки и цвета в сцене. Искусственный шум описывает искажения, вызванные электрическими колебаниями в датчике и ошибками аналого-цифрового преобразования. Blur имитирует нефокусированный линз или движение камеры относительно сцены.

Общие операции предварительной обработки изображений включают удаление шума, сглаживание с сохранением края, преобразование цветового пространства, улучшение контрастности и морфологию.

Если у вас есть Image Processing Toolbox™, можно обработать данные с помощью этих операций, а также любых других функций в тулбоксе. Для примера, который показывает, как создать и применить эти преобразования, смотрите Дополнение изображений для рабочих процессов глубокого обучения с использованием Image Processing Toolbox.

Тип обработки	Описание	Выборочные функции
Изменение размера изображений	Измените размер изображений с помощью фиксированного коэффициента масштабирования или на целевой размер	`imresize` (Image Processing Toolbox), `imresize3`(Набор Image Processing Toolbox)
Изображения деформации	Применить случайное отражение, вращение, шкалу, сдвиг и перемещение к изображениям	`randomAffine2d` (Image Processing Toolbox), `randomAffine3d`(Набор Image Processing Toolbox)
Обрезка изображений	Обрезка изображения до целевого размера из центра или случайного положения	`centerCropWindow2d` (Image Processing Toolbox), `centerCropWindow3d`(Набор Image Processing Toolbox) `randomWindow2d` (Image Processing Toolbox), `randomCropWindow3d`(Набор Image Processing Toolbox)
Цвет дрожания	Случайным образом настройте оттенок, насыщение, яркость или контрастность изображения	`jitterColorHSV`(Набор Image Processing Toolbox)
Симулируйте шум	Добавьте случайный Гауссов, Пуассон, соль и перец или мультипликативный шум	`imnoise`(Набор Image Processing Toolbox)
Симулируйте размытие	Добавьте Гауссов или прямое размытие движения	`imgaussfilt` (Image Processing Toolbox), `imgaussfilt3`(Набор Image Processing Toolbox) `imfilter`(Набор Image Processing Toolbox)

Обнаружение объектов

Данные обнаружения объектов состоят из изображения и ограничивающих рамок, которые описывают местоположение и характеристики объектов в изображении.

Если у вас есть Computer Vision Toolbox™, то можно использовать приложения Image Labeler (Computer Vision Toolbox) и Video Labeler (Computer Vision Toolbox) для интерактивной маркировки ROIs и экспорта данных о метках для обучения нейронной сети. Если у вас есть Automated Driving Toolbox™, то вы также используете приложение Ground Truth Labeler (Automated Driving Toolbox) для создания маркированных основных истин обучающих данных.

При преобразовании изображения необходимо выполнить идентичное преобразование с соответствующими ограничивающими рамками. Если у вас есть Computer Vision Toolbox, можно обработать данные ограничивающего прямоугольника с помощью операций в таблице. Пример, в котором показано, как создать и применить эти преобразования, см. в разделе «Увеличение ограничивающих рамок для обнаружения объектов». Для получения дополнительной информации смотрите Начало работы с Обнаружением объектов Используя Глубокое Обучение (Computer Vision Toolbox).

Тип обработки	Описание	Выборочные функции
Изменение размера ограничивающих рамок	Измените размер ограничивающих рамок на фиксированный масштабный коэффициент или на целевой размер	`bboxresize` (Computer Vision Toolbox)
Обрезка ограничивающих рамок	Обрезать ограничивающий прямоугольник до целевого размера от центра или случайного положения	`bboxcrop` (Computer Vision Toolbox)
Ограничительные рамки деформации	Примените отражение, вращение, шкалу, сдвиг и перемещение к ограничивающим прямоугольникам	`bboxwarp` (Computer Vision Toolbox)

Семантическая сегментация

Семантические данные сегментации состоят из изображений и соответствующих пиксельных меток, представленных в виде категориальных массивов.

Если у вас есть Computer Vision Toolbox, то можно использовать приложения Image Labeler (Computer Vision Toolbox) и Video Labeler (Computer Vision Toolbox) для интерактивной маркировки пикселей и экспорта данных о метках для настройки нейронной сети. Если у вас есть Automated Driving Toolbox, то вы также используете приложение Ground Truth Labeler (Automated Driving Toolbox) для создания маркированных основных истин обучающих данных.

Когда вы преобразовываете изображение, вы должны выполнить идентичное преобразование с соответствующим пиксельным маркированным изображением. Если у вас есть Image Processing Toolbox, то можно предварительно обработать изображения меток пикселей с помощью функций в таблице и любой другой функции тулбокса, которая поддерживает категориальный вход. Для примера, который показывает, как создать и применить эти преобразования, смотрите Увеличение Пиксельных Меток для Семантической Сегментации. Для получения дополнительной информации смотрите Начало работы с семантической сегментацией с использованием глубокого обучения (Computer Vision Toolbox).

Тип обработки	Описание	Выборочные функции
Изменение размера меток пикселей	Измените размер изображений меток пикселей с помощью фиксированного коэффициента масштабирования или до целевого размера	`imresize`(Набор Image Processing Toolbox)
Обрезка меток пикселей	Обрезать изображение метки пикселя до целевого размера из центра или случайного положения	`imcrop`(Набор Image Processing Toolbox) `centerCropWindow2d` (Image Processing Toolbox), `centerCropWindow3d`(Набор Image Processing Toolbox) `randomWindow2d` (Image Processing Toolbox), `randomCropWindow3d`(Набор Image Processing Toolbox)
Метки пикселей деформации	Применить случайное отражение, вращение, шкалу, сдвиг и перемещение к изображениям меток пикселей	`randomAffine2d` (Image Processing Toolbox), `randomAffine3d`(Набор Image Processing Toolbox)

Приложения обработки сигналов

Signal Processing Toolbox™ позволяет вам обесценивать, сглаживать, детрендировать и сбрасывать сигналы. Можно дополнить обучающие данные шумом, многолучевым замиранием и синтетическими сигналами, такими как импульсы и щебет. Можно также создать маркированные наборы сигналов с помощью приложения Signal Labeler (Signal Processing Toolbox) и labeledSignalSet (Signal Processing Toolbox) объект. Для примера, который показывает, как создать и применить эти преобразования, смотрите Сегментацию формы волны с использованием глубокого обучения.

Wavelet Toolbox™ и Signal Processing Toolbox позволяют вам генерировать 2-D частотно-временные представления данных временных рядов, которые вы можете использовать в качестве входов изображений для приложений классификации сигналов. Для получения примера смотрите Классификация временных рядов с помощью Вейвлета анализа и глубокого обучения. Точно так же можно извлечь последовательности из данных сигнала, чтобы использовать их в качестве входа для сетей LSTM. Для получения примера смотрите Классификацию сигналов ЭКГ с использованием длинных краткосрочных Памятей сетей (Signal Processing Toolbox).

Communications Toolbox™ расширяются по функциональности обработки сигналов, чтобы вы могли выполнить коррекцию ошибок, перемежение, модуляцию, фильтрацию, синхронизацию и эквализацию систем связи. Для примера, который показывает, как создать и применить эти преобразования, смотрите Классификацию модуляции с глубоким обучением.

Можно обработать данные сигнала с помощью функций в таблице, а также любых других функциональных возможностей в каждом тулбоксе.

Тип обработки	Описание	Выборочные функции
Чистые сигналы	Примените медианную фильтрацию или скользящее среднее значение к сигналу Удалите полиномиальный тренд Переопределите сигнал к новой фиксированной скорости	`medfilt1` (Signal Processing Toolbox), `smoothdata` `detrend` `downsample` (Signal Processing Toolbox), `interp` (Signal Processing Toolbox), `upsample`(Набор Signal Processing Toolbox)
Фильтрация сигналов	Выполните lowpass, highpass и полосно-заграждающую фильтрацию БИХ и конечных импульсных характеристик сигналов Проект БИХ и конечных импульсных характеристик фильтров Применение БИХ и конечных импульсных характеристик фильтров	`bandpass` (Signal Processing Toolbox), `bandstop` (Signal Processing Toolbox), `highpass` (Signal Processing Toolbox), `lowpass`(Набор Signal Processing Toolbox) `butter` (Signal Processing Toolbox), `designfilt` (Signal Processing Toolbox), `fir1` (Signal Processing Toolbox), `gaussdesign` (Signal Processing Toolbox), `rcosdesign`(Набор Signal Processing Toolbox) `filter`
Сигналы увеличения	Добавьте белый Гауссов шум к сигналу с помощью Communications Toolbox Настройте информацию о времени сигнала и выполните многолучевое замирание с помощью Communications Toolbox Добавьте синтетические щебеты и формы волны	`awgn` (Communications Toolbox) `chirp` (Signal Processing Toolbox), `square` (Signal Processing Toolbox), `rectpuls` (Signal Processing Toolbox), `sawtooth`(Набор Signal Processing Toolbox)
Создайте частотно-временные представления	Создайте спектрограммы, скалограммы и другие 2-D представления сигналов 1-D	`pspectrum` (Signal Processing Toolbox), `xspectrogram`(Набор Signal Processing Toolbox) `fsst` (Signal Processing Toolbox), `ifsst`(Набор Signal Processing Toolbox) `stft` (Signal Processing Toolbox), `istft`(Набор Signal Processing Toolbox) `cwt` (Wavelet Toolbox)
Извлечение функций из сигналов	Оценка мгновенной частоты и спектральной энтропии	`instfreq` (Signal Processing Toolbox), `pentropy`(Набор Signal Processing Toolbox)

Приложения обработки аудио

Audio Toolbox™ предоставляет инструменты для обработки звука, анализа речи и акустического измерения. Используйте эти инструменты для извлечения слуховых функций и преобразования аудиосигналов. Увеличение аудио данных с рандомизированным или детерминированным масштабированием времени, растяжением времени и перемены тангажа. Вы также можете создать маркированные основные истины обучающих данных с помощью приложения Audio Labeler (Audio Toolbox). Вы можете обрабатывать аудиоданные с помощью функций этой таблицы, а также любых других функций в тулбоксе. Пример, показывающий, как создать и применить эти преобразования, см. в Augment Audio Dataset (Audio Toolbox).

Тип обработки Описание Выборочные функции Выходы выборки

Увеличение звуковых данных

Выполните случайное или детерминированную перемену тангажа, изменение шкалы времени, сдвиг времени, сложение шума и регулирование объема

Тип обработки	Описание	Выборочные функции	Выходы выборки
Увеличение звуковых данных	Выполните случайное или детерминированную перемену тангажа, изменение шкалы времени, сдвиг времени, сложение шума и регулирование объема	`audioDataAugmenter` (Audio Toolbox), `audioTimeScaler` (Audio Toolbox), `shiftPitch` (Audio Toolbox), `stretchAudio` (Audio Toolbox)
Извлечение аудио функций	Извлеките спектральные параметры из аудиосегментов	`audioFeatureExtractor` (Audio Toolbox), `mfcc` (Audio Toolbox)	Обработанный выход: ans = struct with fields: mfcc: [1 2 3 4 5 6 7 8 9 10 11 12 13] mfccDelta: [14 15 16 17 18 19 20 21 22 23 24 25 26] mfccDeltaDelta: [27 28 29 30 31 32 33 34 35 36 37 38 39] spectralCentroid: 40 pitch: 41
Создайте частотно-временные представления	Создайте mel spectrograms и другие 2-D представления аудиосигналов	`melSpectrogram` (Audio Toolbox), `mdct` (Audio Toolbox)

audioDataAugmenter (Audio Toolbox), audioTimeScaler (Audio Toolbox), shiftPitch (Audio Toolbox), stretchAudio (Audio Toolbox)

Извлечение аудио функций

Извлеките спектральные параметры из аудиосегментов

audioFeatureExtractor (Audio Toolbox), mfcc (Audio Toolbox)

Обработанный выход:

ans = struct with fields:
                mfcc: [1 2 3 4 5 6 7 8 9 10 11 12 13]
           mfccDelta: [14 15 16 17 18 19 20 21 22 23 24 25 26]
      mfccDeltaDelta: [27 28 29 30 31 32 33 34 35 36 37 38 39]
    spectralCentroid: 40
               pitch: 41

Создайте частотно-временные представления

Создайте mel spectrograms и другие 2-D представления аудиосигналов

melSpectrogram (Audio Toolbox), mdct (Audio Toolbox)

Текстовая аналитика

Text Analytics Toolbox™ включает инструменты для обработки необработанного текста из источников, таких как журналы оборудования, ленты новостей, опросы, отчеты операторов и социальные сети. Используйте эти инструменты, чтобы извлечь текст из популярных файловых форматов, предварительно обработать необработанный текст, извлечь отдельные слова или многословные фразы (n-граммы), преобразовать текст в числовые представления и создать статистические модели. Обработать текстовые данные можно с помощью функций этой таблицы, а также любых других функциональных возможностей тулбокса. Пример, показывающий начало работы, см. в разделе Подготовка текстовых данных к анализу (Symbolic Math Toolbox).

Тип обработки Описание Выборочные функции Выходы выборки

Токенизация текста

Разобрать текст на слова и пунктуацию

Тип обработки	Описание	Выборочные функции	Выходы выборки
Токенизация текста	Разобрать текст на слова и пунктуацию	`tokenizedDocument` (Symbolic Math Toolbox)	Оригинал: `"A few tree limbs greater than 6 inches down on HWY 18 in Roseland."` Обработанный выход: `15 tokens: A few tree limbs greater than 6 inches down on HWY 18 in Roseland` `.`
Чистый текст	Удалите изменения в формах слов и падежах Удалите пунктуацию Удалите стоповые слова, короткие слова и длинные слова	`normalizeWords` (Symbolic Math Toolbox) `erasePunctuation` (Symbolic Math Toolbox) `removeStopWords` (Symbolic Math Toolbox), `removeShortWords` (Symbolic Math Toolbox), `removeLongWords` (Symbolic Math Toolbox)	Обработанный выход: `15 tokens: a few tree limb great than 6 inch down on hwy 18 in roseland` `.` `14 tokens: a few tree limb great than 6 inch down on hwy 18 in roseland` `8 tokens: few tree limb great inch down hwy roseland`

tokenizedDocument (Symbolic Math Toolbox)

Оригинал:

"A few tree limbs greater than 6 inches down on HWY 18 in Roseland."

Обработанный выход:

15 tokens: A few tree limbs greater than 6 inches down on HWY 18 in Roseland .

Чистый текст

Удалите изменения в формах слов и падежах
Удалите пунктуацию
Удалите стоповые слова, короткие слова и длинные слова

normalizeWords (Symbolic Math Toolbox)
erasePunctuation (Symbolic Math Toolbox)
removeStopWords (Symbolic Math Toolbox), removeShortWords (Symbolic Math Toolbox), removeLongWords (Symbolic Math Toolbox)

Обработанный выход:

15 tokens: a few tree limb great than 6 inch down on hwy 18 in roseland .

14 tokens: a few tree limb great than 6 inch down on hwy 18 in roseland

8 tokens: few tree limb great inch down hwy roseland

См. также

combine | read | trainingOptions | trainNetwork | transform

Документация