В этом примере показано, как задать выходную функцию, которая запускается в каждой итерации во время обучения глубоких нейронных сетей. Если вы задаете выходные функции при помощи 'OutputFcn'
аргумент пары "имя-значение" trainingOptions
, затем trainNetwork
вызывает эти функции однажды запуск обучения, после каждой учебной итерации, и однажды после того, как обучение закончилось. Каждый раз выходные функции называются, trainNetwork
передает структуру, содержащую информацию, такую как текущий номер итерации, потеря и точность. Можно использовать выходные функции, чтобы отобразить или построить информацию о прогрессе или остановить обучение. Чтобы остановить обучение рано, заставьте свою выходную функцию возвратить true
. Если какая-либо выходная функция возвращает true
, затем обучение закончило and trainNetwork
возвращает последнюю сеть.
Чтобы остановиться обучение, когда потеря на наборе валидации прекратит уменьшаться, просто задайте данные о валидации и терпение валидации с помощью 'ValidationData'
и 'ValidationPatience'
аргументы пары "имя-значение" trainingOptions
, соответственно. Терпение валидации является числом раз, что потеря на наборе валидации может быть больше, чем или равняться ранее самой маленькой потере, прежде чем сетевое обучение остановится. Можно добавить дополнительный критерий остановки с помощью выходных функций. В этом примере показано, как создать выходную функцию, которая останавливает обучение, когда точность классификации на данных о валидации прекращает улучшаться. Выходная функция задана в конце скрипта.
Загрузите обучающие данные, который содержит 5 000 изображений цифр. Отложите 1000 из изображений для сетевой валидации.
[XTrain,YTrain] = digitTrain4DArrayData; idx = randperm(size(XTrain,4),1000); XValidation = XTrain(:,:,:,idx); XTrain(:,:,:,idx) = []; YValidation = YTrain(idx); YTrain(idx) = [];
Создайте сеть, чтобы классифицировать данные изображения цифры.
layers = [ imageInputLayer([28 28 1]) convolution2dLayer(3,8,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,16,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,32,'Padding','same') batchNormalizationLayer reluLayer fullyConnectedLayer(10) softmaxLayer classificationLayer];
Задайте опции для сетевого обучения. Чтобы проверить сеть равномерно во время обучения, задайте данные о валидации. Выберите 'ValidationFrequency'
значение так, чтобы сеть была проверена однажды в эпоху.
Чтобы остановить обучение, когда точность классификации на наборе валидации прекратит улучшаться, задайте stopIfAccuracyNotImproving
как выходная функция. Второй входной параметр stopIfAccuracyNotImproving
число раз, что точность на наборе валидации может быть меньшей, чем или равняться ранее самой высокой точности, прежде чем сетевое обучение остановится. Выберите любое большое значение для максимального количества эпох, чтобы обучаться. Обучение не должно достигать итоговой эпохи, потому что обучение останавливается автоматически.
miniBatchSize = 128; validationFrequency = floor(numel(YTrain)/miniBatchSize); options = trainingOptions('sgdm', ... 'InitialLearnRate',0.01, ... 'MaxEpochs',100, ... 'MiniBatchSize',miniBatchSize, ... 'VerboseFrequency',validationFrequency, ... 'ValidationData',{XValidation,YValidation}, ... 'ValidationFrequency',validationFrequency, ... 'Plots','training-progress', ... 'OutputFcn',@(info)stopIfAccuracyNotImproving(info,3));
Обучите сеть. Обучение останавливается, когда точность валидации прекращает увеличиваться.
net = trainNetwork(XTrain,YTrain,layers,options);
Training on single CPU. Initializing input data normalization. |======================================================================================================================| | Epoch | Iteration | Time Elapsed | Mini-batch | Validation | Mini-batch | Validation | Base Learning | | | | (hh:mm:ss) | Accuracy | Accuracy | Loss | Loss | Rate | |======================================================================================================================| | 1 | 1 | 00:00:03 | 7.81% | 12.70% | 2.7155 | 2.5169 | 0.0100 | | 1 | 31 | 00:00:05 | 71.88% | 74.70% | 0.8804 | 0.8133 | 0.0100 | | 2 | 62 | 00:00:07 | 86.72% | 87.80% | 0.3929 | 0.4471 | 0.0100 | | 3 | 93 | 00:00:09 | 94.53% | 94.00% | 0.2230 | 0.2535 | 0.0100 | | 4 | 124 | 00:00:11 | 96.09% | 96.60% | 0.1482 | 0.1755 | 0.0100 | | 5 | 155 | 00:00:13 | 99.22% | 97.50% | 0.1017 | 0.1312 | 0.0100 | | 6 | 186 | 00:00:14 | 99.22% | 97.90% | 0.0783 | 0.1129 | 0.0100 | | 7 | 217 | 00:00:16 | 100.00% | 98.00% | 0.0558 | 0.0944 | 0.0100 | | 8 | 248 | 00:00:18 | 100.00% | 97.80% | 0.0441 | 0.0871 | 0.0100 | | 9 | 279 | 00:00:20 | 100.00% | 98.10% | 0.0349 | 0.0790 | 0.0100 | | 10 | 310 | 00:00:21 | 100.00% | 98.30% | 0.0275 | 0.0682 | 0.0100 | | 11 | 341 | 00:00:23 | 100.00% | 98.30% | 0.0242 | 0.0628 | 0.0100 | | 12 | 372 | 00:00:25 | 100.00% | 98.60% | 0.0217 | 0.0579 | 0.0100 | | 13 | 403 | 00:00:27 | 100.00% | 98.70% | 0.0191 | 0.0545 | 0.0100 | | 14 | 434 | 00:00:28 | 100.00% | 98.80% | 0.0167 | 0.0518 | 0.0100 | | 15 | 465 | 00:00:30 | 100.00% | 98.80% | 0.0145 | 0.0490 | 0.0100 | | 16 | 496 | 00:00:32 | 100.00% | 98.90% | 0.0127 | 0.0464 | 0.0100 | | 17 | 527 | 00:00:34 | 100.00% | 99.00% | 0.0112 | 0.0439 | 0.0100 | | 18 | 558 | 00:00:35 | 100.00% | 98.90% | 0.0101 | 0.0418 | 0.0100 | | 19 | 589 | 00:00:37 | 100.00% | 99.10% | 0.0092 | 0.0402 | 0.0100 | | 20 | 620 | 00:00:39 | 100.00% | 99.10% | 0.0086 | 0.0388 | 0.0100 | | 21 | 651 | 00:00:40 | 100.00% | 99.10% | 0.0080 | 0.0376 | 0.0100 | | 22 | 682 | 00:00:42 | 100.00% | 99.00% | 0.0076 | 0.0366 | 0.0100 | |======================================================================================================================| Training finished: Stopped by OutputFcn.
Задайте выходную функцию stopIfAccuracyNotImproving(info,N)
,
который останавливает сетевое обучение, если лучшая точность классификации на данных о валидации не улучшается для N
сетевые валидации подряд. Этот критерий похож на встроенный критерий остановки с помощью потери валидации, за исключением того, что это применяется к точности классификации вместо потери.
function stop = stopIfAccuracyNotImproving(info,N) stop = false; % Keep track of the best validation accuracy and the number of validations for which % there has not been an improvement of the accuracy. persistent bestValAccuracy persistent valLag % Clear the variables when training starts. if info.State == "start" bestValAccuracy = 0; valLag = 0; elseif ~isempty(info.ValidationLoss) % Compare the current validation accuracy to the best accuracy so far, % and either set the best accuracy to the current accuracy, or increase % the number of validations for which there has not been an improvement. if info.ValidationAccuracy > bestValAccuracy valLag = 0; bestValAccuracy = info.ValidationAccuracy; else valLag = valLag + 1; end % If the validation lag is at least N, that is, the validation accuracy % has not improved for at least N validations, then return true and % stop training. if valLag >= N stop = true; end end end
trainNetwork
| trainingOptions