fullyConnectedLayer

Полносвязный слой

расширьте все на странице

Описание

Полносвязный слой умножает вход на матрицу веса и затем добавляет вектор смещения.

Создание

Синтаксис

layer = fullyConnectedLayer(outputSize)

layer = fullyConnectedLayer(outputSize,Name,Value)

Описание

layer = fullyConnectedLayer(outputSize) возвращает полносвязный слой и задает OutputSize свойство.

пример

layer = fullyConnectedLayer(outputSize,Name,Value) устанавливает дополнительные Параметры и Инициализацию, Изучите Уровень и Регуляризацию и Name свойства с помощью пар "имя-значение". Например, fullyConnectedLayer(10,'Name','fc1') создает полносвязный слой с выходным размером 10 и имя 'fc1'. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в одинарные кавычки.

Свойства

развернуть все

Полностью соединенный

`OutputSize` 'OutputSize'
положительное целое число

Выведите размер для полносвязного слоя в виде положительного целого числа.

Пример: 10

`InputSize` — Введите размер
`'auto'` (значение по умолчанию) | положительное целое число

Введите размер для полносвязного слоя в виде положительного целого числа или 'auto'. Если InputSize 'auto', затем программное обеспечение автоматически определяет входной размер во время обучения.

Параметры и инициализация

`WeightsInitializer` — Функция, чтобы инициализировать веса
`'glorot'` (значение по умолчанию) | `'he'` | `'orthogonal'` | `'narrow-normal'` | `'zeros'` | `'ones'` | указатель на функцию

Функция, чтобы инициализировать веса в виде одного из следующего:

'glorot' – Инициализируйте веса инициализатором Glorot [1] (также известный как инициализатор Ксавьера). Инициализатор Glorot независимо выборки от равномерного распределения с нулевым средним значением и отклонением 2/(InputSize + OutputSize).
'he' – Инициализируйте веса Им инициализатор [2]. Он выборки инициализатора от нормального распределения с нулевым средним значением и отклонением 2/InputSize.
'orthogonal' – Инициализируйте входные веса Q, ортогональная матрица, данная разложением QR Z = Q R для случайного матричного Z, произведенного от модульного нормального распределения. [3]
'narrow-normal' – Инициализируйте веса путем независимой выборки от нормального распределения с нулевым средним и стандартным отклонением 0.01.
'zeros' – Инициализируйте веса нулями.
'ones' – Инициализируйте веса единицами.
Указатель на функцию – Инициализирует веса пользовательской функцией. Если вы задаете указатель на функцию, то функция должна иметь форму weights = func(sz), где sz размер весов. Для примера смотрите, Задают Пользовательскую Функцию Инициализации Веса.

Слой только инициализирует веса когда Weights свойство пусто.

Типы данных: char | string | function_handle

`BiasInitializer` — Функция, чтобы инициализировать смещение
`'zeros'` (значение по умолчанию) | `'narrow-normal'` | `'ones'` | указатель на функцию

Функция, чтобы инициализировать смещение в виде одного из следующего:

'zeros' – Инициализируйте смещение нулями.
'ones' – Инициализируйте смещение единицами.
'narrow-normal' – Инициализируйте смещение путем независимой выборки от нормального распределения с нулевым средним и стандартным отклонением 0.01.
Указатель на функцию – Инициализирует смещение пользовательской функцией. Если вы задаете указатель на функцию, то функция должна иметь форму bias = func(sz), где sz размер смещения.

Слой только инициализирует смещение когда Bias свойство пусто.

Типы данных: char | string | function_handle

`Weights` — Веса слоя
`[]` (значение по умолчанию) | матрица

Веса слоя в виде матрицы.

Веса слоя являются настраиваемыми параметрами. Можно задать начальное значение для весов непосредственно с помощью Weights свойство слоя. При обучении сети, если Weights свойство слоя непусто, затем trainNetwork использует Weights свойство как начальное значение. Если Weights свойство пусто, затем trainNetwork использует инициализатор, заданный WeightsInitializer свойство слоя.

В учебное время, Weights OutputSize- InputSize матрица.

Типы данных: single | double

`Bias` — Смещения слоя
`[]` (значение по умолчанию) | матрица

Слой смещает в виде матрицы.

Смещения слоя являются настраиваемыми параметрами. При обучении сети, если Bias непусто, затем trainNetwork использует Bias свойство как начальное значение. Если Bias пусто, затем trainNetwork использует инициализатор, заданный BiasInitializer.

В учебное время, Bias OutputSize- 1 матрица.

Типы данных: single | double

Изучите уровень и регуляризацию

`WeightLearnRateFactor` — Фактор скорости обучения для весов
1 (значение по умолчанию) | неотрицательный скаляр

Фактор скорости обучения для весов в виде неотрицательного скаляра.

Программное обеспечение умножает этот фактор на глобальную скорость обучения, чтобы определить скорость обучения для весов в этом слое. Например, если WeightLearnRateFactor 2, затем скорость обучения для весов в этом слое является дважды текущей глобальной скоростью обучения. Программное обеспечение определяет глобальную скорость обучения на основе настроек, заданных с trainingOptions функция.

Пример 2

`BiasLearnRateFactor` — Фактор скорости обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

Фактор скорости обучения для смещений в виде неотрицательного скаляра.

Программное обеспечение умножает этот фактор на глобальную скорость обучения, чтобы определить скорость обучения для смещений в этом слое. Например, если BiasLearnRateFactor 2, затем скорость обучения для смещений в слое является дважды текущей глобальной скоростью обучения. Программное обеспечение определяет глобальную скорость обучения на основе настроек, заданных с trainingOptions функция.

Пример 2

`WeightL2Factor` — Фактор регуляризации L2 для весов
1 (значение по умолчанию) | неотрицательный скаляр

Фактор регуляризации L2 для весов в виде неотрицательного скаляра.

Программное обеспечение умножает этот фактор на глобальный фактор регуляризации L2, чтобы определить регуляризацию L2 для весов в этом слое. Например, если WeightL2Factor 2, затем регуляризация L2 для весов в этом слое является дважды глобальным фактором регуляризации L2. Можно задать глобальный фактор регуляризации L2 использование trainingOptions функция.

Пример 2

`BiasL2Factor` — Фактор регуляризации L2 для смещений
0 (значений по умолчанию) | неотрицательный скаляр

Фактор регуляризации L2 для смещений в виде неотрицательного скаляра.

Программное обеспечение умножает этот фактор на глобальный фактор регуляризации L2, чтобы определить регуляризацию L2 для смещений в этом слое. Например, если BiasL2Factor 2, затем регуляризация L2 для смещений в этом слое является дважды глобальным фактором регуляризации L2. Можно задать глобальный фактор регуляризации L2 использование trainingOptions функция.

Пример 2

Слой

`Name` — Имя слоя
`''` (значение по умолчанию) | вектор символов | строковый скаляр

Имя слоя в виде вектора символов или строкового скаляра. Чтобы включать слой в график слоев, необходимо задать непустое, уникальное имя слоя. Если вы обучаете серийную сеть со слоем и Name установлен в '', затем программное обеспечение автоматически присваивает имя к слою в учебное время.

Типы данных: char | string

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

Количество входных параметров слоя. Этот слой принимает один вход только.

Типы данных: double

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

Введите имена слоя. Этот слой принимает один вход только.

Типы данных: cell

`NumOutputs` — Количество выходных параметров
1 (значение по умолчанию)

Количество выходных параметров слоя. Этот слой имеет один выход только.

Типы данных: double

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)

Выведите имена слоя. Этот слой имеет один выход только.

Типы данных: cell

Примеры

свернуть все

Создайте полносвязный слой

Скрипт Open Live Script

Создайте полносвязный слой с выходным размером 10 и имя 'fc1'.

layer = fullyConnectedLayer(10,'Name','fc1')

layer = 
  FullyConnectedLayer with properties:

          Name: 'fc1'

   Hyperparameters
     InputSize: 'auto'
    OutputSize: 10

   Learnable Parameters
       Weights: []
          Bias: []

  Show all properties

Включайте полносвязный слой в Layer массив.

layers = [ ...
    imageInputLayer([28 28 1])
    convolution2dLayer(5,20)
    reluLayer
    maxPooling2dLayer(2,'Stride',2)
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer]

layers = 
  7x1 Layer array with layers:

     1   ''   Image Input             28x28x1 images with 'zerocenter' normalization
     2   ''   Convolution             20 5x5 convolutions with stride [1  1] and padding [0  0  0  0]
     3   ''   ReLU                    ReLU
     4   ''   Max Pooling             2x2 max pooling with stride [2  2] and padding [0  0  0  0]
     5   ''   Fully Connected         10 fully connected layer
     6   ''   Softmax                 softmax
     7   ''   Classification Output   crossentropyex

Задайте начальные веса и смещения в полносвязном слое

Скрипт Open Live Script

Чтобы задать веса и функции инициализатора смещения, используйте WeightsInitializer и BiasInitializer свойства соответственно. Чтобы задать веса и смещения непосредственно, используйте Weights и Bias свойства соответственно.

Задайте функцию инициализации

Создайте полносвязный слой с выходным размером 10 и задайте инициализатор весов, чтобы быть Им инициализатор.

outputSize = 10;
layer = fullyConnectedLayer(outputSize,'WeightsInitializer','he')

layer = 
  FullyConnectedLayer with properties:

          Name: ''

   Hyperparameters
     InputSize: 'auto'
    OutputSize: 10

   Learnable Parameters
       Weights: []
          Bias: []

  Show all properties

Обратите внимание на то, что Weights и Bias свойства пусты. В учебное время программное обеспечение инициализирует эти свойства с помощью заданных функций инициализации.

Задайте пользовательскую функцию инициализации

Чтобы задать вашу собственную функцию инициализации для весов и смещений, установите WeightsInitializer и BiasInitializer свойства к указателю на функцию. Для этих свойств задайте указатели на функцию, которые берут размер весов и смещений как ввод и вывод инициализированное значение.

Создайте полносвязный слой с выходным размером 10 и задайте инициализаторы, которые производят веса и смещения от Распределения Гаусса со стандартным отклонением 0,0001.

outputSize = 10;
weightsInitializationFcn = @(sz) rand(sz) * 0.0001;
biasInitializationFcn = @(sz) rand(sz) * 0.0001;

layer = fullyConnectedLayer(outputSize, ...
    'WeightsInitializer',@(sz) rand(sz) * 0.0001, ...
    'BiasInitializer',@(sz) rand(sz) * 0.0001)

layer = 
  FullyConnectedLayer with properties:

          Name: ''

   Hyperparameters
     InputSize: 'auto'
    OutputSize: 10

   Learnable Parameters
       Weights: []
          Bias: []

  Show all properties

Снова, Weights и Bias свойства пусты. В учебное время программное обеспечение инициализирует эти свойства с помощью заданных функций инициализации.

Задайте веса и сместите непосредственно

Создайте полносвязный слой с выходным размером 10 и установите веса и смещение к W и b в файле MAT FCWeights.mat соответственно.

outputSize = 10;
load FCWeights

layer = fullyConnectedLayer(outputSize, ...
    'Weights',W, ...
    'Bias',b)

layer = 
  FullyConnectedLayer with properties:

          Name: ''

   Hyperparameters
     InputSize: 720
    OutputSize: 10

   Learnable Parameters
       Weights: [10x720 double]
          Bias: [10x1 double]

  Show all properties

Здесь, Weights и Bias свойства содержат заданные значения. В учебное время, если эти свойства непусты, то программное обеспечение использует заданные значения в качестве начальных весов и смещений. В этом случае программное обеспечение не использует функции инициализатора.

Больше о

развернуть все

Полносвязный слой

Полносвязный слой умножает вход на матрицу веса и затем добавляет вектор смещения.

Сверточные (и прореживающий) слои сопровождаются одним или несколькими полносвязными слоями.

Как следует из названия, все нейроны в полносвязном слое соединяются со всеми нейронами в предыдущем слое. Этот слой сочетает все функции (локальная информация) изученный предыдущими слоями через изображение, чтобы идентифицировать большие шаблоны. Для проблем классификации последний полносвязный слой сочетает функции, чтобы классифицировать изображения. Это - причина что outputSize аргумент последнего полносвязного слоя сети равен количеству классов набора данных. Для проблем регрессии выходной размер должен быть равен количеству переменных отклика.

Можно также настроить скорость обучения и параметры регуляризации для этого слоя с помощью связанных аргументов пары "имя-значение" при создании полносвязного слоя. Если вы принимаете решение не настроить их, то trainNetwork использует глобальные учебные параметры, заданные trainingOptions функция. Для получения дополнительной информации на глобальной переменной и опциях обучения слоя, смотрите Настроенные Параметры и Обучите Сверточную нейронную сеть.

Полносвязный слой умножает вход на матрицу веса W и затем добавляет вектор смещения b.

Если вход к слою является последовательностью (например, в сети LSTM), то полносвязный слой действует независимо на каждый временной шаг. Например, если слой перед полносвязным слоем выводит массив X размера D-by-N-by-S, то полносвязный слой выводит массив Z размера outputSize- N S. На временном шаге t соответствующая запись Z $W X_{t} + b$ , где $X_{t}$ обозначает временной шаг t X.

Вопросы совместимости

развернуть все

Инициализацией весов по умолчанию является Glorot

Поведение изменяется в R2019a

Начиная в R2019a, программное обеспечение, по умолчанию, инициализирует веса слоя этого слоя с помощью инициализатора Glorot. Это поведение помогает стабилизировать обучение и обычно уменьшает учебное время глубоких сетей.

В предыдущих релизах программное обеспечение, по умолчанию, инициализирует веса слоя путем выборки от нормального распределения с нулевым средним значением и отклонением 0.01. Чтобы воспроизвести это поведение, установите 'WeightsInitializer' опция слоя к 'narrow-normal'.

Ссылки

[1] Glorot, Ксавьер и Иосуа Бенхио. "Изучая Трудность Учебных Глубоких Нейронных сетей Прямого распространения". В Продолжениях Тринадцатой Международной конференции по вопросам Искусственного интеллекта и Статистики, 249–356. Сардиния, Италия: AISTATS, 2010.

[2] Он, Kaiming, Сянюй Чжан, Шаоцин Жэнь и Цзянь Сунь. "Копаясь Глубоко в Выпрямителях: Превышение Эффективности Человеческого Уровня на Классификации ImageNet". В Продолжениях 2 015 Международных конференций IEEE по вопросам Компьютерного зрения, 1026–1034. Вашингтон, округ Колумбия: Общество Компьютерного зрения IEEE, 2015.

[3] Saxe, Эндрю М., Джеймс Л. Макклеллэнд и Сурья Гэнгули. "Точные решения нелинейной динамики изучения в глубоких линейных нейронных сетях". arXiv предварительно распечатывают arXiv:1312.6120 (2013).

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Генерация кода графического процессора
Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Темы

Введенный в R2016a

Документация

fullyConnectedLayer

Описание

Создание

Синтаксис

Описание

Свойства

Полностью соединенный

OutputSize 'OutputSize' положительное целое число

InputSize — Введите размер 'auto' (значение по умолчанию) | положительное целое число

Параметры и инициализация

WeightsInitializer — Функция, чтобы инициализировать веса 'glorot' (значение по умолчанию) | 'he' | 'orthogonal' | 'narrow-normal' | 'zeros' | 'ones' | указатель на функцию

BiasInitializer — Функция, чтобы инициализировать смещение 'zeros' (значение по умолчанию) | 'narrow-normal' | 'ones' | указатель на функцию

Weights — Веса слоя [] (значение по умолчанию) | матрица

Bias — Смещения слоя [] (значение по умолчанию) | матрица

Изучите уровень и регуляризацию

WeightLearnRateFactor — Фактор скорости обучения для весов 1 (значение по умолчанию) | неотрицательный скаляр

BiasLearnRateFactor — Фактор скорости обучения для смещений 1 (значение по умолчанию) | неотрицательный скаляр

WeightL2Factor — Фактор регуляризации L2 для весов 1 (значение по умолчанию) | неотрицательный скаляр

BiasL2Factor — Фактор регуляризации L2 для смещений 0 (значений по умолчанию) | неотрицательный скаляр

Слой

Name — Имя слоя '' (значение по умолчанию) | вектор символов | строковый скаляр

NumInputs — Количество входных параметров 1 (значение по умолчанию)

InputNames — Введите имена {'in'} (значение по умолчанию)

NumOutputs — Количество выходных параметров 1 (значение по умолчанию)

OutputNames — Выведите имена {'out'} (значение по умолчанию)

Примеры

Создайте полносвязный слой

Задайте начальные веса и смещения в полносвязном слое

Больше о

Полносвязный слой

Вопросы совместимости

Инициализацией весов по умолчанию является Glorot

Ссылки

Расширенные возможности

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Генерация кода графического процессора Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Смотрите также

Темы

Документация Deep Learning Toolbox

Поддержка

`OutputSize` 'OutputSize'
положительное целое число

`InputSize` — Введите размер
`'auto'` (значение по умолчанию) | положительное целое число

`WeightsInitializer` — Функция, чтобы инициализировать веса
`'glorot'` (значение по умолчанию) | `'he'` | `'orthogonal'` | `'narrow-normal'` | `'zeros'` | `'ones'` | указатель на функцию

`BiasInitializer` — Функция, чтобы инициализировать смещение
`'zeros'` (значение по умолчанию) | `'narrow-normal'` | `'ones'` | указатель на функцию

`Weights` — Веса слоя
`[]` (значение по умолчанию) | матрица

`Bias` — Смещения слоя
`[]` (значение по умолчанию) | матрица

`WeightLearnRateFactor` — Фактор скорости обучения для весов
1 (значение по умолчанию) | неотрицательный скаляр

`BiasLearnRateFactor` — Фактор скорости обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

`WeightL2Factor` — Фактор регуляризации L2 для весов
1 (значение по умолчанию) | неотрицательный скаляр

`BiasL2Factor` — Фактор регуляризации L2 для смещений
0 (значений по умолчанию) | неотрицательный скаляр

`Name` — Имя слоя
`''` (значение по умолчанию) | вектор символов | строковый скаляр

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

`NumOutputs` — Количество выходных параметров
1 (значение по умолчанию)

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Генерация кода графического процессора
Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.