Линейный нейрон обучен находить не уникальное решение неопределенной задачи.
X задает один шаблон входа 1 элемента (векторов-столбцов). T задает связанный 1-элементный целевой объект ( векторы-столбцы). Обратите внимание, что существуют бесконечные значения W и B, такие что выражение W * X + B = T верно. Проблемы с несколькими решениями называются недоопределенными.
X = [+1.0]; T = [+0.5];
ERRSURF вычисляет ошибки для нейрона y с областью значений y возможных значений веса и смещения. PLOTES строит график этой поверхности ошибки с графиком y контура под. Дно оврага в поверхности ошибки соответствует бесконечным решениям этой задачи.
w_range = -1:0.2:1; b_range = -1:0.2:1;
ES = errsurf(X,T,w_range,b_range,'purelin');
plotes(w_range,b_range,ES);
MAXLINLR находит самую быструю стабильную скорость обучения для обучения линейной сети y. NEWLIN создает линейный нейрон y. NEWLIN принимает эти аргументы: 1) Rx2 матрица минимальных и максимальных значений для R входа элементов, 2) Количество элементов в векторе выхода, 3) Вход векторе задержки и 4) скорости обучения.
maxlr = maxlinlr(X,'bias');
net = newlin([-2 2],1,[0],maxlr);
Переопределите параметры обучения по умолчанию, задав цель эффективности.
net.trainParam.goal = 1e-10;
Чтобы показать путь обучения, мы будем обучать только одну эпоху в y время и вызывать PLOTEP каждую эпоху. График показывает y историю обучения. Каждая точка представляет эпоху, и синие линии показывают каждое изменение, сделанное правилом обучения (по умолчанию Widrow-Hoff).
% [net,tr] = train(net,X,T); net.trainParam.epochs = 1; net.trainParam.show = NaN; h=plotep(net.IW{1},net.b{1},mse(T-net(X))); [net,tr] = train(net,X,T); r = tr; epoch = 1; while true epoch = epoch+1; [net,tr] = train(net,X,T); if length(tr.epoch) > 1 h = plotep(net.IW{1,1},net.b{1},tr.perf(2),h); r.epoch=[r.epoch epoch]; r.perf=[r.perf tr.perf(2)]; r.vperf=[r.vperf NaN]; r.tperf=[r.tperf NaN]; else break end end tr=r;
Здесь мы строим график решения NEWLIND. Обратите внимание, что решения TRAIN (белая точка) и SOLVELIN (красный круг) не совпадают. На самом деле, TRAINWH вернёт другое решение для различных начальных условий, в то время как SOLVELIN всегда вернёт одно и то же решение.
solvednet = newlind(X,T); hold on; plot(solvednet.IW{1,1},solvednet.b{1},'ro') hold off;
Функция train выводит обученную сеть и историю y производительности обучения (tr). Здесь ошибки строятся относительно эпох обучения: Как только ошибка достигает цели, было найдено адекватное решение для W и B. Однако, поскольку проблема недостаточно определена, это решение не является уникальным.
subplot(1,2,1); plotperform(tr);
Теперь мы можем протестировать ассоциатор с одним из исходных входов, 1.0, и увидеть, вернёт ли он цель, 0.5. Результат очень близок к 0,5. Ошибка может быть уменьшена дополнительно, если требуется, путем продолжения обучения с TRAINWH с использованием y меньшей цели ошибки.
x = 1.0; y = net(x)
y = 0.5000