В этом примере показано, как выполнить неотрицательную матричную факторизацию.
Загрузите выборочные данные.
load moore X = moore(:,1:5); rng('default'); % For reproducibility
Вычислите ранг два приближения X
использование мультипликативного алгоритма обновления, который начинается с пяти случайных начальных значений для W
и H
.
opt = statset('MaxIter',10,'Display','final'); [W0,H0] = nnmf(X,2,'replicates',5,'options',opt,'algorithm','mult');
rep iteration rms resid |delta x| 1 10 358.296 0.00190554 2 10 78.3556 0.000351747 3 10 230.962 0.0172839 4 10 326.347 0.00739552 5 10 361.547 0.00705539 Final root mean square residual = 78.3556
'mult'
алгоритм чувствителен к начальным значениям, который делает его хорошим выбором при использовании 'replicates'
найти W
и H
от нескольких случайных начальных значений.
Теперь выполните использование факторизации переменный алгоритм наименьших квадратов, который сходится быстрее и более последовательно. Запустите в 100 раз больше итераций, начинающихся с начального W0
и H0
идентифицированный выше.
opt = statset('Maxiter',1000,'Display','final'); [W,H] = nnmf(X,2,'w0',W0,'h0',H0,'options',opt,'algorithm','als');
rep iteration rms resid |delta x| 1 2 77.5315 0.000830334 Final root mean square residual = 77.5315
Два столбца W
преобразованные предикторы. Две строки H
дайте относительные вклады каждого из этих пяти предикторов в X
к предикторам в W
. Отобразите H.
H
H = 2×5
0.0835 0.0190 0.1782 0.0072 0.9802
0.0559 0.0250 0.9969 0.0085 0.0497
Пятый предиктор в X
(вес 0.9802), строго влияет на первый предиктор в W
. Третий предиктор в X
(вес 0.9969), строго влияет на второй предиктор в W
.
Визуализируйте относительные вклады предикторов в X
с biplot
, показ данных и исходных переменных на пробеле столбца W
.
biplot(H','scores',W,'varlabels',{'','','v3','','v5'}); axis([0 1.1 0 1.1]) xlabel('Column 1') ylabel('Column 2')