Устойчивая обратная связь
net.trainFcn = 'trainrp' устанавливает сеть trainFcn свойство.
[ обучает сеть с trainedNet,tr] = train(net,...)trainrp.
trainrp сетевая учебная функция, которая обновляет вес и значения смещения согласно эластичному алгоритму обратного распространения (Rprop).
Обучение происходит согласно trainrp параметры обучения, показанные здесь с их значениями по умолчанию:
net.trainParam.epochs — Максимальное количество эпох, чтобы обучаться. Значением по умолчанию является 1000.
net.trainParam.show — Эпохи между отображениями (NaN ни для каких отображений). Значением по умолчанию является 25.
net.trainParam.showCommandLine — Сгенерируйте командную строку выход. Значением по умолчанию является false.
net.trainParam.showWindow — Покажите учебный графический интерфейс пользователя. Значением по умолчанию является true.
net.trainParam.goal — Цель эффективности. Значение по умолчанию 0.
net.trainParam.time — Максимальное время, чтобы обучаться в секундах. Значением по умолчанию является inf.
net.trainParam.min_grad — Минимальный градиент эффективности. Значением по умолчанию является 1e-5.
net.trainParam.max_fail — Максимальные отказы валидации. Значением по умолчанию является 6.
net.trainParam.lr — Скорость обучения. Значением по умолчанию является 0.01.
net.trainParam.delt_inc — Шаг, чтобы взвесить изменение. Значением по умолчанию является 1.2.
net.trainParam.delt_dec — Декремент, чтобы взвесить изменение. Значением по умолчанию является 0.5.
net.trainParam.delta0 — Начальное изменение веса. Значением по умолчанию является 0.07.
net.trainParam.deltamax — Максимальное изменение веса. Значением по умолчанию является 50.0.
trainrp может обучить любую сеть пока ее вес, сетевой вход, и передаточные функции имеют производные функции.
Обратная связь используется, чтобы вычислить производные эффективности perf относительно веса и переменных X смещения. Каждая переменная настроена согласно следующему:
dX = deltaX.*sign(gX);
где элементы deltaX все инициализируются к delta0, и gX градиент. В каждой итерации элементы deltaX изменяются. Если элемент gX изменяет знак от одной итерации до следующего, затем соответствующий элемент deltaX уменьшен delta_dec. Если элемент gX обеспечивает тот же знак от одной итерации до следующего, затем соответствующий элемент deltaX увеличен на delta_inc. См. Riedmiller, M. и Х. Брауна, “Прямой метод адаптации для более быстрой обратной связи, учащейся: алгоритм RPROP”, Продолжения Международной конференции IEEE по вопросам Нейронных сетей, 1993, стр 586–591.
Обучение останавливается, когда любое из этих условий происходит:
Максимальное количество epochs (повторения) достигнуты.
Максимальная сумма time превышен.
Эффективность минимизирована к goal.
Градиент эффективности падает ниже min_grad.
Эффективность валидации увеличила больше, чем max_fail времена с прошлого раза это уменьшилось (при использовании валидации).
[1] Riedmiller, M. и Х. Браун, “Прямой метод адаптации для более быстрой обратной связи, учащейся: алгоритм RPROP”, Продолжения Международной конференции IEEE по вопросам Нейронных сетей, 1993, стр 586–591.
traingdm | traingda | traingdx | trainlm | traincgp | traincgf | traincgb | trainscg | trainoss | trainbfg