На этой странице представлен список уровней глубокого обучения в MATLAB ®.
Чтобы узнать, как создавать сети из слоев для различных задач, см. следующие примеры.
| Задача | Подробнее |
|---|---|
| Создание сетей глубокого обучения для классификации или регрессии изображений. | Создание простой сети глубокого обучения для классификации |
| Создание сетей глубокого обучения для данных последовательности и временных рядов. | Классификация последовательностей с использованием глубокого обучения Прогнозирование временных рядов с использованием глубокого обучения |
| Создание сети глубокого обучения для аудиоданных. | Распознавание речевых команд с помощью глубокого обучения |
| Создание сети глубокого обучения для текстовых данных. |
Для создания слоев различных типов используются следующие функции. Можно также использовать приложение Deep Network Designer для интерактивного создания сетей.
Сведения об определении собственных пользовательских слоев см. в разделе Определение пользовательских слоев глубокого обучения.
| Слой | Описание |
|---|---|
| Уровень ввода изображения вводит 2-D изображения в сеть и применяет нормализацию данных. | |
| Входной слой 3-D изображения вводит 3-D изображения или объемы в сеть и применяет нормализацию данных. | |
| Входной уровень последовательности вводит данные последовательности в сеть. | |
| Входной уровень элемента вводит данные элемента в сеть и применяет нормализацию данных. Этот слой используется при наличии набора числовых скаляров, представляющих элементы (данные без пространственных или временных измерений). | |
| Входной уровень ROI вводит изображения в сеть обнаружения объектов Fast R-CNN. |
| Слой | Описание |
|---|---|
| 2-D сверточный слой применяет скользящие сверточные фильтры к входу. | |
| 3-D сверточный слой применяет скользящие кубические сверточные фильтры к трехмерному входу. | |
| 2-D сгруппированный сверточный слой разделяет входные каналы на группы и применяет скользящие сверточные фильтры. Используйте сгруппированные сверточные слои для разделяемых по каналам (также называемых разделяемыми по глубине) сверток. | |
| Транспонированный слой свертки 2-D увеличивает выборку карт элементов. | |
| Транспонированный 3-D сверточный слой увеличивает трехмерные карты признаков. | |
| Полностью связанный слой умножает входной сигнал на весовую матрицу и затем добавляет вектор смещения. |
| Слой | Описание |
|---|---|
| Входной уровень последовательности вводит данные последовательности в сеть. | |
| Уровень LSTM распознает долгосрочные зависимости между временными шагами во временных рядах и данными последовательности. | |
| Уровень двунаправленного LSTM (BiLSTM) изучает двунаправленные долгосрочные зависимости между временными шагами временных рядов или данных последовательности. Эти зависимости могут быть полезны, если необходимо, чтобы сеть извлекала уроки из полного временного ряда на каждом временном шаге. | |
| Уровень GRU распознает зависимости между временными шагами во временных рядах и данными последовательности. | |
| Слой складывания последовательности преобразует пакет последовательностей изображений в пакет изображений. Используйте слой сворачивания последовательности для выполнения операций свертки на временных шагах последовательностей изображений независимо. | |
| Слой развертки последовательности восстанавливает структуру последовательности входных данных после свертывания последовательности. | |
| Плоский слой сворачивает пространственные размеры входа в размер канала. | |
| Слой встраивания слов отображает индексы слов в векторы. |
| Слой | Описание |
|---|---|
| Уровень ReLU выполняет пороговую операцию для каждого элемента входа, где любое значение меньше нуля устанавливается равным нулю. | |
| Уровень ReLU с утечкой выполняет пороговую операцию, где любое входное значение, меньшее нуля, умножается на фиксированный скаляр. | |
| Подрезанный слой ReLU выполняет пороговую операцию, при которой любое входное значение меньше нуля устанавливается равным нулю, а любое значение выше подрезанного потолка устанавливается на этот подрезанный потолок. | |
| Уровень активации ЗЭС выполняет операцию идентификации на положительных входах и экспоненциальную нелинейность на отрицательных входах. | |
| Слой активации гиперболической касательной (tanh) применяет функцию tanh на входах слоя. | |
| Слой активации swish применяет функцию swish на входах слоев. | |
| Уровень PReLU выполняет пороговую операцию, где для каждого канала любое входное значение, меньшее нуля, умножается на скаляр, полученный во время обучения. |
| Слой | Описание |
|---|---|
| Уровень пакетной нормализации нормализует мини-пакет данных по всем наблюдениям для каждого канала независимо. Чтобы ускорить обучение сверточной нейронной сети и снизить чувствительность к инициализации сети, используйте уровни пакетной нормализации между сверточными слоями и нелинейностями, такими как уровни ReLU. | |
| Уровень нормализации группы нормализует мини-пакет данных по сгруппированным подмножествам каналов для каждого наблюдения независимо. Чтобы ускорить обучение сверточной нейронной сети и снизить чувствительность к инициализации сети, используйте уровни групповой нормализации между сверточными слоями и нелинейностями, такими как уровни ReLU. | |
| Уровень нормализации экземпляра нормализует мини-пакет данных по каждому каналу для каждого наблюдения независимо. Чтобы улучшить сходимость тренировок сверточной нейронной сети и снизить чувствительность к гиперпараметрам сети, используйте уровни нормализации экземпляров между сверточными слоями и нелинейностями, такими как уровни ReLU. | |
| Уровень нормализации уровня нормализует мини-пакет данных по всем каналам для каждого наблюдения независимо. Чтобы ускорить обучение повторяющихся и многослойных перцептронных нейронных сетей и снизить чувствительность к инициализации сети, используйте уровни нормализации уровня после обучаемых уровней, таких как LSTM и полностью соединенных уровней. | |
| Канальный уровень локальной (кросс-канальной) нормализации выполняет канальную нормализацию. | |
| Уровень отсева случайным образом устанавливает входные элементы в ноль с заданной вероятностью. | |
| Слой подрезки 2-D применяется 2-D обрезки к вводу. | |
| Слой 3-D подрезки обрезает объем 3-D до размера карты входных элементов. | |
| Слой 2-D изменения размера изменяет размер 2-D, вводимого масштабным коэффициентом, на заданную высоту и ширину или на размер карты опорных входных элементов. |
| Слой изменения размера 3-D изменяет размер 3-D, вводимый масштабным коэффициентом, на заданную высоту, ширину и глубину, или на размер карты опорных входных элементов. |
| Слой | Описание |
|---|---|
| Средний уровень объединения выполняет понижающую дискретизацию путем разделения входных данных на прямоугольные области объединения и вычисления средних значений каждой области. | |
| Уровень 3-D среднего объединения выполняет понижающую дискретизацию путем разделения трехмерного ввода на области кубического объединения и вычисления средних значений каждой области. | |
| Уровень глобального среднего объединения выполняет понижающую дискретизацию путем вычисления среднего значения высоты и ширины входного сигнала. | |
| 3-D уровень глобального среднего объединения выполняет понижающую дискретизацию путем вычисления среднего значения высоты, ширины и глубины входного сигнала. | |
| Уровень максимального объединения выполняет понижающую дискретизацию путем разделения входных данных на прямоугольные области объединения и вычисления максимума каждой области. | |
| Уровень объединения 3-D max выполняет понижающую дискретизацию путем разделения трехмерного ввода на области кубоидального объединения и вычисления максимума каждой области. | |
| Уровень глобального максимального пула выполняет понижающую дискретизацию путем вычисления максимума высоты и ширины входного сигнала. | |
| 3-D уровень глобального максимального объединения выполняет понижающую дискретизацию путем вычисления максимума высоты, ширины и глубины входного сигнала. | |
| Уровень макс. расхолаживания распаковывает выходные данные уровня макс. пула. |
| Слой | Описание |
|---|---|
| Уровень сложения добавляет входные данные от нескольких уровней нейронной сети по элементам. | |
| Уровень умножения умножает входы от нескольких нейронных сетевых уровней по элементам. | |
| Слой конкатенации глубины принимает входные данные одинаковой высоты и ширины и объединяет их вдоль третьего размера (размера канала). | |
| Слой конкатенации принимает входные данные и выполняет их конкатенацию вдоль заданного размера. Входные данные должны иметь одинаковый размер во всех размерах, кроме размера конкатенации. | |
| Взвешенный уровень сложения масштабирует и добавляет входные данные от нескольких нейронных сетевых уровней по элементам. |
| Слой | Описание |
|---|---|
| Входной уровень ROI вводит изображения в сеть обнаружения объектов Fast R-CNN. |
| Уровень максимального объединения ROI выводит карты характеристик фиксированного размера для каждого прямоугольного ROI во входной карте характеристик. Этот уровень используется для создания сети обнаружения объектов Fast или Faster R-CNN. |
| Слой выравнивания ROI выводит карты элементов фиксированного размера для каждого прямоугольного ROI в карте входных элементов. Этот уровень используется для создания сети Mask-RCNN. |
| Слой поля привязки хранит поля привязки для карты элементов, используемой в сетях обнаружения объектов. |
| Слой предложения области выводит ограничивающие рамки вокруг потенциальных объектов в изображении как часть сети предложений области (RPN) в пределах более быстрого R-CNN. |
| Уровень объединения SSD объединяет выходные данные карт элементов для последующей регрессии и вычисления потерь классификации. |
| Слой «пробел-глубина» преобразует пространственные блоки ввода в размер глубины. Этот слой используется в тех случаях, когда необходимо объединить карты элементов разного размера без отбрасывания каких-либо данных элементов. |
| Слой 2-D depth to space преобразует данные из размера глубины в блоки 2-D пространственных данных. |
| Уровень softmax сети предложений области (RPN) применяет функцию активации softmax к входу. Этот уровень используется для создания более быстрой сети обнаружения объектов R-CNN. |
| Уровень фокальных потерь предсказывает классы объектов с использованием фокальных потерь. |
| Слой классификации сети предложений области (RPN) классифицирует области изображения как объект или фон с помощью функции перекрестных потерь энтропии. Этот уровень используется для создания более быстрой сети обнаружения объектов R-CNN. |
| Слой регрессии параллелепипеда позволяет уточнить расположение ограничивающего параллелепипеда с помощью функции сглаживания потерь L1. Этот уровень используется для создания сети обнаружения объектов Fast или Faster R-CNN. |
| Слой | Описание |
|---|---|
| Слой проекта и изменения формы принимает в качестве входных данных 1 на 1 по-numLatentInputs и преобразует их в изображения заданного размера. Слои проекта и изменения формы используются для изменения формы шума, вводимого в GAN. |
| Слой встраивания и изменения формы принимает в качестве входных числовых индексов категориальных элементов и преобразует их в изображения заданного размера. Слои встраивания и изменения формы используются для ввода категориальных данных в условные GAN. |
| Слой | Описание |
|---|---|
| Уровень softmax применяет функцию softmax к входу. | |
| Сигмоидальный слой применяет сигмоидальную функцию к входу таким образом, что выход ограничен в интервале (0,1). | |
| Уровень классификации вычисляет потери перекрестной энтропии для задач классификации и взвешенной классификации с взаимоисключающими классами. | |
| Уровень регрессии вычисляет потери в полусреднем квадрате для задач регрессии. | |
| Слой классификации пикселей обеспечивает категориальную метку для каждого пикселя изображения или вокселя. |
| Слой классификации пикселей Dice предоставляет категориальную метку для каждого пикселя изображения или вокселя с использованием обобщенной потери Dice. |
| Уровень фокальных потерь предсказывает классы объектов с использованием фокальных потерь. |
| Уровень softmax сети предложений области (RPN) применяет функцию активации softmax к входу. Этот уровень используется для создания более быстрой сети обнаружения объектов R-CNN. |
| Слой классификации сети предложений области (RPN) классифицирует области изображения как объект или фон с помощью функции перекрестных потерь энтропии. Этот уровень используется для создания более быстрой сети обнаружения объектов R-CNN. |
| Слой регрессии параллелепипеда позволяет уточнить расположение ограничивающего параллелепипеда с помощью функции сглаживания потерь L1. Этот уровень используется для создания сети обнаружения объектов Fast или Faster R-CNN. |
| Слой классификации пикселей Тверского предоставляет категориальную метку для каждого пикселя изображения или вокселя с использованием потерь Тверского. |
| Уровень SSE классификации вычисляет сумму потерь ошибок квадратов для проблем классификации. |
| Уровень MAE регрессии вычисляет среднюю абсолютную потерю ошибок для проблем регрессии. |
Конструктор глубоких сетей | trainingOptions | trainNetwork