Градиентный спуск с обратной связью импульса
net.trainFcn = 'traingdm'
[net,tr] = train(net,...)
traingdm сетевая учебная функция, которая обновляет вес и значения смещения согласно градиентному спуску с импульсом.
net.trainFcn = 'traingdm' устанавливает сеть trainFcn свойство.
[net,tr] = train(net,...) обучает сеть с traingdm.
Обучение происходит согласно traingdm параметры обучения, показанные здесь с их значениями по умолчанию:
net.trainParam.epochs | 1000 | Максимальное количество эпох, чтобы обучаться |
net.trainParam.goal | 0 | Цель эффективности |
net.trainParam.lr | 0.01 | Скорость обучения |
net.trainParam.max_fail | 6 | Максимальные отказы валидации |
net.trainParam.mc | 0.9 | Постоянный импульс |
net.trainParam.min_grad | 1e-5 | Минимальный градиент эффективности |
net.trainParam.show | 25 | Эпохи между показом прогресса |
net.trainParam.showCommandLine | false | Сгенерируйте командную строку выход |
net.trainParam.showWindow | true | Покажите учебный графический интерфейс пользователя |
net.trainParam.time | inf | Максимальное время, чтобы обучаться в секундах |
Можно создать стандартную сеть, которая использует traingdm с feedforwardnet или cascadeforwardnet. Подготовить пользовательскую сеть, которая будет обучена с traingdm,
Установите net.trainFcn к 'traingdm'. Это устанавливает net.trainParam к traingdmпараметры по умолчанию.
Установите net.trainParam свойства к требуемым значениям.
В любом случае, вызывая train с получившейся сетью обучает сеть с traingdm.
Смотрите help feedforwardnet и help cascadeforwardnet для примеров.
traingdm может обучить любую сеть пока ее вес, сетевой вход, и передаточные функции имеют производные функции.
Обратная связь используется, чтобы вычислить производные эффективности perf относительно веса и переменных X смещения. Каждая переменная настроена согласно градиентному спуску с импульсом,
dX = mc*dXprev + lr*(1-mc)*dperf/dX
где dXprev предыдущее изменение в весе или смещении.
Обучение останавливается, когда любое из этих условий происходит:
Максимальное количество epochs (повторения) достигнуты.
Максимальная сумма time превышен.
Эффективность минимизирована к goal.
Градиент эффективности падает ниже min_grad.
Эффективность валидации увеличила больше, чем max_fail времена с прошлого раза это уменьшилось (при использовании валидации).