exponenta event banner

Недоопределенная проблема

Линейный нейрон обучен находить неуникальное решение неопределенной проблемы.

X определяет один 1-элементный входной шаблон (векторы столбцов). T определяет связанный 1-элементный целевой объект (векторы столбцов). Обратите внимание, что существуют бесконечные значения W и B, так что выражение W * X + B = T верно. Проблемы с несколькими решениями называются недооцененными.

X = [+1.0];
T = [+0.5];

ERRSURF вычисляет ошибки для y-нейрона с диапазоном y возможных значений веса и смещения. PLOTES строит график этой поверхности ошибки с контурным графиком y под ним. Дно долины в поверхности ошибки соответствует бесконечным решениям этой задачи.

w_range = -1:0.2:1;  b_range = -1:0.2:1;
ES = errsurf(X,T,w_range,b_range,'purelin');
plotes(w_range,b_range,ES);

MAXLINLR находит самую быструю стабильную скорость обучения для обучения y линейной сети. NEWLIN создает y линейный нейрон. NEWLIN принимает следующие аргументы: 1) Rx2 матрица значений min и max для R входных элементов, 2) количество элементов в выходном векторе, 3) вектор задержки ввода и 4) скорость обучения.

maxlr = maxlinlr(X,'bias');
net = newlin([-2 2],1,[0],maxlr);

Переопределите параметры обучения по умолчанию, задав цель производительности.

net.trainParam.goal = 1e-10;

Чтобы показать путь обучения мы будем тренировать только одну эпоху в y время и звонить ПЛОТЕП каждую эпоху. Сюжет показывает y историю тренировки. Каждая точка представляет эпоху, и синие линии показывают каждое изменение, внесенное правилом обучения (по умолчанию Widrow-Hoff).

% [net,tr] = train(net,X,T);
net.trainParam.epochs = 1;
net.trainParam.show = NaN;
h=plotep(net.IW{1},net.b{1},mse(T-net(X)));
[net,tr] = train(net,X,T);
r = tr;
epoch = 1;
while true
   epoch = epoch+1;
   [net,tr] = train(net,X,T);
   if length(tr.epoch) > 1
      h = plotep(net.IW{1,1},net.b{1},tr.perf(2),h);
      r.epoch=[r.epoch epoch];
      r.perf=[r.perf tr.perf(2)];
      r.vperf=[r.vperf NaN];
      r.tperf=[r.tperf NaN];
   else
      break
   end
end
tr=r;

Здесь мы построим график решения NEWLIND. Обратите внимание, что решения TRAIN (белая точка) и SOLVELIN (красная окружность) не совпадают. В действительности, TRAINWH возвращает другое решение для различных начальных условий, в то время как SOLVELIN всегда возвращает одно и то же решение.

solvednet = newlind(X,T);
hold on;
plot(solvednet.IW{1,1},solvednet.b{1},'ro')
hold off;

Функция поезда выводит обученную сеть и историю выполнения обучения (tr). Здесь строятся графики ошибок относительно периодов обучения: Как только ошибка достигает цели, найдено адекватное решение для W и B. Однако, поскольку проблема не определена, это решение не является уникальным.

subplot(1,2,1);
plotperform(tr);

Теперь мы можем проверить ассоциатор с одним из исходных входов, 1.0, и посмотреть, если он возвращает цель, 0.5. Результат очень близок к 0,5. При необходимости эту ошибку можно дополнительно уменьшить путем продолжения обучения с использованием TRAINWH с использованием цели с меньшими ошибками.

x = 1.0;
y = net(x)
y =

    0.5000