Недоопределенная проблема

Линейный нейрон обучен находить не уникальное решение неопределенной задачи.

X задает один шаблон входа 1 элемента (векторов-столбцов). T задает связанный 1-элементный целевой объект ( векторы-столбцы). Обратите внимание, что существуют бесконечные значения W и B, такие что выражение W * X + B = T верно. Проблемы с несколькими решениями называются недоопределенными.

X = [+1.0];
T = [+0.5];

ERRSURF вычисляет ошибки для нейрона y с областью значений y возможных значений веса и смещения. PLOTES строит график этой поверхности ошибки с графиком y контура под. Дно оврага в поверхности ошибки соответствует бесконечным решениям этой задачи.

w_range = -1:0.2:1;  b_range = -1:0.2:1;
ES = errsurf(X,T,w_range,b_range,'purelin');
plotes(w_range,b_range,ES);

MAXLINLR находит самую быструю стабильную скорость обучения для обучения линейной сети y. NEWLIN создает линейный нейрон y. NEWLIN принимает эти аргументы: 1) Rx2 матрица минимальных и максимальных значений для R входа элементов, 2) Количество элементов в векторе выхода, 3) Вход векторе задержки и 4) скорости обучения.

maxlr = maxlinlr(X,'bias');
net = newlin([-2 2],1,[0],maxlr);

Переопределите параметры обучения по умолчанию, задав цель эффективности.

net.trainParam.goal = 1e-10;

Чтобы показать путь обучения, мы будем обучать только одну эпоху в y время и вызывать PLOTEP каждую эпоху. График показывает y историю обучения. Каждая точка представляет эпоху, и синие линии показывают каждое изменение, сделанное правилом обучения (по умолчанию Widrow-Hoff).

% [net,tr] = train(net,X,T);
net.trainParam.epochs = 1;
net.trainParam.show = NaN;
h=plotep(net.IW{1},net.b{1},mse(T-net(X)));
[net,tr] = train(net,X,T);
r = tr;
epoch = 1;
while true
   epoch = epoch+1;
   [net,tr] = train(net,X,T);
   if length(tr.epoch) > 1
      h = plotep(net.IW{1,1},net.b{1},tr.perf(2),h);
      r.epoch=[r.epoch epoch];
      r.perf=[r.perf tr.perf(2)];
      r.vperf=[r.vperf NaN];
      r.tperf=[r.tperf NaN];
   else
      break
   end
end
tr=r;

Здесь мы строим график решения NEWLIND. Обратите внимание, что решения TRAIN (белая точка) и SOLVELIN (красный круг) не совпадают. На самом деле, TRAINWH вернёт другое решение для различных начальных условий, в то время как SOLVELIN всегда вернёт одно и то же решение.

solvednet = newlind(X,T);
hold on;
plot(solvednet.IW{1,1},solvednet.b{1},'ro')
hold off;

Функция train выводит обученную сеть и историю y производительности обучения (tr). Здесь ошибки строятся относительно эпох обучения: Как только ошибка достигает цели, было найдено адекватное решение для W и B. Однако, поскольку проблема недостаточно определена, это решение не является уникальным.

subplot(1,2,1);
plotperform(tr);

Теперь мы можем протестировать ассоциатор с одним из исходных входов, 1.0, и увидеть, вернёт ли он цель, 0.5. Результат очень близок к 0,5. Ошибка может быть уменьшена дополнительно, если требуется, путем продолжения обучения с TRAINWH с использованием y меньшей цели ошибки.

x = 1.0;
y = net(x)
y =

    0.5000