traincgb

Обратная связь метода сопряженных градиентов с перезапусками Пауэлла-Биля

Синтаксис

net.trainFcn = 'traincgb' [net,tr] = train(net,...)

Описание

traincgb является сетевой учебной функцией, которая обновляет вес и значения смещения согласно обратной связи метода сопряженных градиентов с перезапусками Пауэлла-Биля.

net.trainFcn = 'traincgb' устанавливает свойство сети trainFcn.

[net,tr] = train(net,...) обучает сеть с traincgb.

Обучение происходит согласно параметрам обучения traincgb, показанным здесь с их значениями по умолчанию:

`net.trainParam.epochs`	1000	Максимальное количество эпох, чтобы обучаться
`net.trainParam.show`	25	Эпохи между отображениями (`NaN` ни для каких отображений)
`net.trainParam.showCommandLine`	`false`	Сгенерируйте командную строку вывод
`net.trainParam.showWindow`	`true`	Покажите учебный графический интерфейс пользователя
`net.trainParam.goal`	0	Цель производительности
`net.trainParam.time`	`inf`	Максимальное время, чтобы обучаться в секундах
`net.trainParam.min_grad`	`1e-10`	Минимальный градиент производительности
`net.trainParam.max_fail`	6	Максимальные отказы валидации
`net.trainParam.searchFcn`	`'srchcha'`	Имя строки ищет стандартную программу, чтобы использовать

Параметры связаны с методами поиска строки (не все используемые для всех методов):

`net.trainParam.scal_tol`	20	Разделитесь на `delta`, чтобы определить допуск к линейному поиску.
`net.trainParam.alpha`	0.001	Масштабный коэффициент, который определяет достаточное сокращение `perf`
`net.trainParam.beta`	0.1	Масштабный коэффициент, который определяет достаточно большой размер шага
`net.trainParam.delta`	0.01	Начальный размер шага на шаге местоположения интервала
`net.trainParam.gama`	0.1	Параметр, чтобы избежать маленьких сокращений производительности, обычно устанавливайте на `0.1` (см. `srch_cha`),
`net.trainParam.low_lim`	0.1	Нижний предел на изменении в размере шага
`net.trainParam.up_lim`	0.5	Верхний предел изменения в размере шага
`net.trainParam.maxstep`	100	Максимальная длина шага
`net.trainParam.minstep`	`1.0e-6`	Минимальная длина шага
`net.trainParam.bmax`	26	Максимальный размер шага

Сетевое использование

Можно создать стандартную сеть, которая использует traincgb с feedforwardnet или cascadeforwardnet.

Подготовить пользовательскую сеть, которая будет обучена с traincgb,

Установите net.trainFcn на 'traincgb'. Это устанавливает net.trainParam на параметры traincgb по умолчанию.
Установите свойства net.trainParam на требуемые значения.

В любом случае, вызывая train с получившейся сетью обучает сеть с traincgb.

Примеры

свернуть все

Обучите нейронную сеть Используя функцию Train `traincgb`

Скрипт Open Live Script

Этот пример показывает, как обучить нейронную сеть с помощью функции train traincgb.

Здесь нейронная сеть обучена, чтобы предсказать содержания жира в организме.

[x, t] = bodyfat_dataset;
net = feedforwardnet(10, 'traincgb');
net = train(net, x, t);
y = net(x);

Больше о

свернуть все

Алгоритм Пауэлла-Биля

Для всех алгоритмов метода сопряженных градиентов поисковое направление периодически сбрасывается к отрицанию градиента. Стандартная точка сброса происходит, когда количество итераций равно количеству сетевых параметров (веса и смещения), но существуют другие методы сброса, которые могут повысить эффективность обучения. Один такой метод сброса был предложен Пауэллом [Powe77], на основе более ранней версии, предложенной Билем [Beal72]. Этот метод перезапускает, если существует очень мало ортогональности, оставленной между текущим градиентом и предыдущим градиентом. Это тестируется со следующим неравенством:

$| g_{k - 1}^{T} g_{k} | \geq 0.2 {‖ g_{k} ‖}^{2}$

Если это условие удовлетворено, поисковое направление сбрасывается к отрицанию градиента.

Стандартная программа traincgb имеет несколько лучшую производительность, чем traincgp для некоторых проблем, несмотря на то, что производительность на любой данной проблеме трудно предсказать. Требования устройства хранения данных для алгоритма Пауэлла-Биля (шесть векторов) немного больше, чем для Полака-Рибиера (четыре вектора).

Алгоритмы

traincgb может обучить любую сеть пока ее вес, сетевой вход, и передаточные функции имеют производные функции.

Обратная связь используется, чтобы вычислить производные производительности perf относительно переменных X смещения и веса. Каждая переменная настроена согласно следующему:

X = X + a*dX;

где dX является поисковым направлением. Параметр a выбран, чтобы минимизировать производительность вдоль поискового направления. Функция поиска строки searchFcn используется, чтобы определить местоположение минимальной точки. Первое поисковое направление является отрицанием градиента производительности. В последующих итерациях поисковое направление вычисляется из нового градиента и предыдущего поискового направления согласно формуле

dX = -gX + dX_old*Z;

где gX является градиентом. Параметр Z может быть вычислен несколькими различными способами. Изменение Пауэлла-Биля метода сопряженных градиентов отличают две функции. Во-первых, алгоритм использует тест, чтобы определить, когда сбросить поисковое направление к отрицанию градиента. Во-вторых, поисковое направление вычисляется из отрицательного градиента, предыдущего поискового направления и последнего поискового направления перед предыдущим сбросом. Смотрите Пауэлла, Математическое программирование, Издание 12, 1977, стр 241 - 254, для более детального обсуждения алгоритма.

Обучение останавливается, когда любое из этих условий происходит:

Максимальное количество epochs (повторения) достигнуто.
Максимальная сумма time превышена.
Производительность минимизирована к goal.
Градиент производительности падает ниже min_grad.
Производительность валидации увеличила больше, чем времена max_fail с прошлого раза, когда это уменьшилось (при использовании валидации).

Ссылки

Пауэлл, M.J.D., “Процедуры перезапуска для метода сопряженных градиентов”, Математическое программирование, Издание 12, 1977, стр 241–254

Документация

traincgb

Синтаксис

Описание

Сетевое использование

Примеры

Обучите нейронную сеть Используя функцию Train `traincgb`

Больше о

Алгоритм Пауэлла-Биля

Алгоритмы

Ссылки

Смотрите также

Представлено до R2006a

Документация Deep Learning Toolbox

Поддержка

Документация

traincgb

Синтаксис

Описание

Сетевое использование

Примеры

Обучите нейронную сеть Используя функцию Train traincgb

Больше о

Алгоритм Пауэлла-Биля

Алгоритмы

Ссылки

Смотрите также

Представлено до R2006a

Документация Deep Learning Toolbox

Поддержка

Обучите нейронную сеть Используя функцию Train `traincgb`