imageInputLayer

Слой ввода изображения

развернуть все на странице

Описание

Уровень ввода изображения вводит 2-D изображения в сеть и применяет нормализацию данных.

Для 3-D ввода изображения используйте image3dInputLayer.

Создание

Синтаксис

layer = imageInputLayer (inputSize)

layer = imageInputLayer (inputSize, Name, Value)

Описание

layer = imageInputLayer(inputSize) возвращает слой ввода изображения и задает InputSize собственность.

пример

layer = imageInputLayer(inputSize,Name,Value) задает дополнительные свойства, используя пары имя-значение. Можно указать несколько пар имя-значение. Заключите каждое имя свойства в отдельные кавычки.

Свойства

развернуть все

Ввод изображения

`InputSize` - Размер входа
вектор строки целых чисел

Размер входных данных, указанный как вектор строки целых чисел [h w c], где h, w, и c соответствуют высоте, ширине и количеству каналов соответственно.

Для изображений в оттенках серого укажите вектор с помощью c равно 1.
Для изображений RGB укажите вектор с помощью c равно 3.
Для мультиспектральных или гиперспектральных изображений укажите вектор с помощью c равно количеству каналов.

Для ввода 3-D изображения или тома используйте image3dInputLayer.

Пример: [224 224 3]

`Normalization` - Нормализация данных
`'zerocenter'` (по умолчанию) | `'zscore'` | `'rescale-symmetric'` | `'rescale-zero-one'` | `'none'` | дескриптор функции

Нормализация данных для применения при каждом прямом распространении данных через входной уровень, определяемая одним из следующих параметров:

'zerocenter' - Вычитание среднего значения, указанного Mean.
'zscore' - Вычитание среднего значения, указанного Mean и делить на StandardDeviation.
'rescale-symmetric' - Масштабировать входные данные в диапазоне [-1, 1] с использованием минимального и максимального значений, указанных в Min и Maxсоответственно.
'rescale-zero-one' - Масштабировать входные данные в диапазоне [0, 1] с использованием минимального и максимального значений, указанных в Min и Maxсоответственно.
'none' - Не нормализуйте входные данные.
дескриптор функции - нормализация данных с помощью указанной функции. Функция должна иметь вид Y = func(X), где X - входные данные и выходные данные; Y - нормализованные данные.

Совет

По умолчанию программа автоматически вычисляет статистику нормализации во время обучения. Чтобы сэкономить время при обучении, укажите необходимые статистические данные для нормализации и установите 'ResetInputNormalization' опция в trainingOptions кому false.

`NormalizationDimension` - Размерность нормализации
`'auto'` (по умолчанию) | `'channel'` | `'element'` | `'all'`

Размер нормализации, указанный как одно из следующих значений:

'auto' - Если вариант обучения false и укажите любую из статистики нормализации (Mean, StandardDeviation, Min, или Max), затем нормализовать по измерениям, соответствующим статистике. В противном случае пересчитайте статистику во время обучения и примените нормализацию канала.
'channel' - Канальная нормализация.
'element' - Элементная нормализация.
'all' - Нормализация всех значений с помощью скалярной статистики.

`Mean` - Среднее значение для нормализации нулевого центра и z-показателя
`[]` (по умолчанию) | массив 3-D | числовой скаляр

Среднее значение для нормализации нулевого центра и z-оценки, указанное как массив h-by-w-by-c, массив 1-by-1-by-c средств на канал, числовой скаляр или [], где h, w и c соответствуют высоте, ширине и количеству каналов среднего значения, соответственно.

При указании Mean собственность, то Normalization должно быть 'zerocenter' или 'zscore'. Если Mean является []затем программное обеспечение вычисляет среднее значение во время обучения.

Это свойство можно задать при создании сетей без обучения (например, при сборке сетей с помощью assembleNetwork).

`StandardDeviation` - Стандартное отклонение для нормализации показателя z
`[]` (по умолчанию) | массив 3-D | числовой скаляр

Стандартное отклонение для нормализации z-показателя, определяемое как массив h-by-w-by-c, массив 1-by-1-by-c средств на канал, числовой скаляр или [], где h, w и c соответствуют высоте, ширине и количеству каналов стандартного отклонения соответственно.

При указании StandardDeviation собственность, то Normalization должно быть 'zscore'. Если StandardDeviation является []затем программное обеспечение вычисляет стандартное отклонение во время обучения.

Это свойство можно задать при создании сетей без обучения (например, при сборке сетей с помощью assembleNetwork).

`Min` - Минимальное значение для масштабирования
`[]` (по умолчанию) | массив 3-D | числовой скаляр

Минимальное значение для масштабирования, указанное как массив h-by-w-by-c, массив 1-by-1-by-c минимумов на канал, числовой скаляр или [], где h, w и c соответствуют высоте, ширине и количеству каналов минимумов соответственно.

При указании Min собственность, то Normalization должно быть 'rescale-symmetric' или 'rescale-zero-one'. Если Min является [], то программное обеспечение вычисляет минимум во время обучения.

Это свойство можно задать при создании сетей без обучения (например, при сборке сетей с помощью assembleNetwork).

`Max` - Максимальное значение для масштабирования
`[]` (по умолчанию) | массив 3-D | числовой скаляр

Максимальное значение для масштабирования, указанное как массив h-by-w-by-c, массив 1-by-1-by-c максимумов на канал, числовой скаляр или [], где h, w и c соответствуют высоте, ширине и количеству каналов максимумов соответственно.

При указании Max собственность, то Normalization должно быть 'rescale-symmetric' или 'rescale-zero-one'. Если Max является [], то программное обеспечение вычисляет максимум во время обучения.

Это свойство можно задать при создании сетей без обучения (например, при сборке сетей с помощью assembleNetwork).

`DataAugmentation` - Преобразования увеличения объема данных
`'none'` (по умолчанию) | `'randcrop'` | `'randfliplr'` | массив ячеек `'randcrop'` и `'randfliplr'`

Примечание

DataAugmentation свойство не рекомендуется. Для предварительной обработки изображений с обрезкой, отражением и другими геометрическими преобразованиями используйте augmentedImageDatastore вместо этого.

Преобразование увеличения данных для использования во время обучения, указанное как одно из следующих.

'none' - Нет увеличения данных
'randcrop' - Взять случайный урожай из тренировочного образа. Случайная обрезка имеет тот же размер, что и размер ввода.
'randfliplr' - Случайное разворот входных изображений по горизонтали с вероятностью 50%.
Массив ячеек 'randcrop' и 'randfliplr'. Программа применяет увеличение в порядке, указанном в массиве ячеек.

Увеличение данных изображения является еще одним способом уменьшения переоснащения [1], [2].

Типы данных: string | char | cell

Слой

`Name` - Имя слоя
`''` (по умолчанию) | символьный вектор | строковый скаляр

Имя слоя, указанное как символьный вектор или строковый скаляр. Чтобы включить слой в график слоев, необходимо указать непустое уникальное имя слоя. Если вы обучаете последовательную сеть с уровнем и Name имеет значение ''затем программа автоматически присваивает имя слою во время обучения.

Типы данных: char | string

`NumInputs` - Количество входов
0 (по умолчанию)

Количество входов слоя. Слой не имеет входных данных.

Типы данных: double

`InputNames` - Входные имена
`{}` (по умолчанию)

Входные имена слоя. Слой не имеет входных данных.

Типы данных: cell

`NumOutputs` - Количество выходов
1 (по умолчанию)

Количество выходов уровня. Этот уровень имеет только один выход.

Типы данных: double

`OutputNames` - Имена выходных данных
`{'out'}` (по умолчанию)

Выходные имена слоя. Этот уровень имеет только один выход.

Типы данных: cell

Примеры

свернуть все

Создать слой ввода изображения

Открыть сценарий в реальном времени

Создание слоя ввода изображения для цветных изображений 28 на 28 с именем 'input'. По умолчанию слой выполняет нормализацию данных путем вычитания среднего изображения обучающего набора из каждого входного изображения.

inputlayer = imageInputLayer([28 28 3],'Name','input')

inputlayer = 
  ImageInputLayer with properties:

                      Name: 'input'
                 InputSize: [28 28 3]

   Hyperparameters
          DataAugmentation: 'none'
             Normalization: 'zerocenter'
    NormalizationDimension: 'auto'
                      Mean: []

Включение слоя ввода изображения в Layer массив.

layers = [ ...
    imageInputLayer([28 28 1])
    convolution2dLayer(5,20)
    reluLayer
    maxPooling2dLayer(2,'Stride',2)
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer]

layers = 
  7x1 Layer array with layers:

     1   ''   Image Input             28x28x1 images with 'zerocenter' normalization
     2   ''   Convolution             20 5x5 convolutions with stride [1  1] and padding [0  0  0  0]
     3   ''   ReLU                    ReLU
     4   ''   Max Pooling             2x2 max pooling with stride [2  2] and padding [0  0  0  0]
     5   ''   Fully Connected         10 fully connected layer
     6   ''   Softmax                 softmax
     7   ''   Classification Output   crossentropyex

Вопросы совместимости

развернуть все

`AverageImage` свойство будет удалено

Не рекомендуется начинать с R2019b

AverageImage будет удален. Использовать Mean вместо этого. Чтобы обновить код, замените все экземпляры AverageImage с Mean. Нет различий между свойствами, которые требуют дополнительных обновлений кода.

`imageInputLayer` и `image3dInputLayer`, по умолчанию используйте нормализацию по каналам

Изменение поведения в будущем выпуске

Начиная с R2019b, imageInputLayer и image3dInputLayerпо умолчанию используется нормализация по каналам. В предыдущих версиях эти слои используют нормализацию по элементам. Чтобы воспроизвести это поведение, установите NormalizationDimension опции этих слоев в 'element'.

Ссылки

[1] Крижевский, А., И. Суцкевер, Г. Э. Хинтон. «ImageNet Classification с глубокими сверточными нейронными сетями». Достижения в системах обработки нейронной информации. Том 25, 2012.

[2] Сирешан, Д., У. Мейер, Ж. Шмидхубер. «Многоколонные глубокие нейронные сети для классификации изображений». Конференция IEEE по компьютерному зрению и распознаванию образов, 2012 год.

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Примечания и ограничения по использованию:

Создание кода не поддерживает 'Normalization' задается с помощью дескриптора функции.

Создание кода графического процессора
Создание кода CUDA ® для графических процессоров NVIDIA ® с помощью Coder™ графических процессоров

Примечания и ограничения по использованию:

Создание кода не поддерживает 'Normalization' задается с помощью дескриптора функции.

См. также

Темы

Представлен в R2016a

Документация

imageInputLayer

Описание

Создание

Синтаксис

Описание

Свойства

Ввод изображения

`InputSize` - Размер входа
вектор строки целых чисел

`Normalization` - Нормализация данных
`'zerocenter'` (по умолчанию) | `'zscore'` | `'rescale-symmetric'` | `'rescale-zero-one'` | `'none'` | дескриптор функции

`NormalizationDimension` - Размерность нормализации
`'auto'` (по умолчанию) | `'channel'` | `'element'` | `'all'`

`Mean` - Среднее значение для нормализации нулевого центра и z-показателя
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`StandardDeviation` - Стандартное отклонение для нормализации показателя z
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`Min` - Минимальное значение для масштабирования
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`Max` - Максимальное значение для масштабирования
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`DataAugmentation` - Преобразования увеличения объема данных
`'none'` (по умолчанию) | `'randcrop'` | `'randfliplr'` | массив ячеек `'randcrop'` и `'randfliplr'`

Слой

`Name` - Имя слоя
`''` (по умолчанию) | символьный вектор | строковый скаляр

`NumInputs` - Количество входов
0 (по умолчанию)

`InputNames` - Входные имена
`{}` (по умолчанию)

`NumOutputs` - Количество выходов
1 (по умолчанию)

`OutputNames` - Имена выходных данных
`{'out'}` (по умолчанию)

Примеры

Создать слой ввода изображения

Вопросы совместимости

`AverageImage` свойство будет удалено

`imageInputLayer` и `image3dInputLayer`, по умолчанию используйте нормализацию по каналам

Ссылки

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Создание кода графического процессора
Создание кода CUDA ® для графических процессоров NVIDIA ® с помощью Coder™ графических процессоров

См. также

Темы

Документация по инструментам для глубокого обучения

Поддержка

Документация

imageInputLayer

Описание

Создание

Синтаксис

Описание

Свойства

Ввод изображения

InputSize - Размер входа вектор строки целых чисел

Normalization - Нормализация данных 'zerocenter' (по умолчанию) | 'zscore' | 'rescale-symmetric' | 'rescale-zero-one' | 'none' | дескриптор функции

NormalizationDimension - Размерность нормализации 'auto' (по умолчанию) | 'channel' | 'element' | 'all'

Mean - Среднее значение для нормализации нулевого центра и z-показателя [] (по умолчанию) | массив 3-D | числовой скаляр

StandardDeviation - Стандартное отклонение для нормализации показателя z [] (по умолчанию) | массив 3-D | числовой скаляр

Min - Минимальное значение для масштабирования [] (по умолчанию) | массив 3-D | числовой скаляр

Max - Максимальное значение для масштабирования [] (по умолчанию) | массив 3-D | числовой скаляр

DataAugmentation - Преобразования увеличения объема данных 'none' (по умолчанию) | 'randcrop' | 'randfliplr' | массив ячеек 'randcrop' и 'randfliplr'

Слой

Name - Имя слоя '' (по умолчанию) | символьный вектор | строковый скаляр

NumInputs - Количество входов 0 (по умолчанию)

InputNames - Входные имена {} (по умолчанию)

NumOutputs - Количество выходов 1 (по умолчанию)

OutputNames - Имена выходных данных {'out'} (по умолчанию)

Примеры

Создать слой ввода изображения

Вопросы совместимости

AverageImage свойство будет удалено

imageInputLayer и image3dInputLayer, по умолчанию используйте нормализацию по каналам

Ссылки

Расширенные возможности

Создание кода C/C + + Создайте код C и C++ с помощью MATLAB ® Coder™

Создание кода графического процессора Создание кода CUDA ® для графических процессоров NVIDIA ® с помощью Coder™ графических процессоров

См. также

Темы

Документация по инструментам для глубокого обучения

Поддержка

`InputSize` - Размер входа
вектор строки целых чисел

`Normalization` - Нормализация данных
`'zerocenter'` (по умолчанию) | `'zscore'` | `'rescale-symmetric'` | `'rescale-zero-one'` | `'none'` | дескриптор функции

`NormalizationDimension` - Размерность нормализации
`'auto'` (по умолчанию) | `'channel'` | `'element'` | `'all'`

`Mean` - Среднее значение для нормализации нулевого центра и z-показателя
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`StandardDeviation` - Стандартное отклонение для нормализации показателя z
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`Min` - Минимальное значение для масштабирования
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`Max` - Максимальное значение для масштабирования
`[]` (по умолчанию) | массив 3-D | числовой скаляр

`DataAugmentation` - Преобразования увеличения объема данных
`'none'` (по умолчанию) | `'randcrop'` | `'randfliplr'` | массив ячеек `'randcrop'` и `'randfliplr'`

`Name` - Имя слоя
`''` (по умолчанию) | символьный вектор | строковый скаляр

`NumInputs` - Количество входов
0 (по умолчанию)

`InputNames` - Входные имена
`{}` (по умолчанию)

`NumOutputs` - Количество выходов
1 (по умолчанию)

`OutputNames` - Имена выходных данных
`{'out'}` (по умолчанию)

`AverageImage` свойство будет удалено

`imageInputLayer` и `image3dInputLayer`, по умолчанию используйте нормализацию по каналам

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Создание кода графического процессора
Создание кода CUDA ® для графических процессоров NVIDIA ® с помощью Coder™ графических процессоров