idx = cluster(gm,X) разделяет данные на X в k кластеры, определяемые k Гауссовыми компонентами смеси в gm. Значение в idx(i) - кластерный индекс наблюдения i и указывает компонент с наибольшей апостериорной вероятностью, учитывая наблюдение i.
[idx,nlogL] = cluster(gm,X) также возвращает отрицательную логарифмическую правдоподобность смешанной гауссовской модели gm учитывая данные X.
[idx,nlogL,P] = cluster(gm,X) также возвращает апостериорные вероятности каждого Гауссова компонента смеси в gm учитывая каждое наблюдение в X.
[idx,nlogL,P,logpdf] = cluster(gm,X) также возвращает логарифм предполагаемой функции плотности вероятностей (PDF), рассчитанной при каждом наблюдении в X.
[idx,nlogL,P,logpdf,d2] = cluster(gm,X) также возвращает квадратное расстояние Махаланобиса каждого наблюдения в X каждому Гауссову компоненту смеси в gm.
Сгенерируйте случайные переменные, которые следуют за смесью двух двухмерных Гауссовых распределений при помощи mvnrnd функция. Подбор смешанной гауссовской модели (GMM) к сгенерированным данным при помощи fitgmdist функция. Затем используйте cluster функция для разбиения данных на два кластера, определяемые установленными компонентами GMM.
Задайте параметры распределения (средства и ковариации) двух двухфазных компонентов Гауссовой смеси.
mu1 = [2 2]; % Mean of the 1st component
sigma1 = [2 0; 0 1]; % Covariance of the 1st component
mu2 = [-2 -1]; % Mean of the 2nd component
sigma2 = [1 0; 0 1]; % Covariance of the 2nd component
Сгенерируйте равное количество случайных вариаций из каждого компонента и объедините два набора случайных вариаций.
rng('default') % For reproducibility
r1 = mvnrnd(mu1,sigma1,1000);
r2 = mvnrnd(mu2,sigma2,1000);
X = [r1; r2];
Объединенный набор данных X содержит случайные вариации, следующие за смесью двух двухмерных Гауссовых распределений.
Подбор двухкомпонентного GMM к X.
gm = fitgmdist(X,2);
График X при помощи scatter. Визуализируйте подобранную модель gm при помощи pdf и fcontour.
figure
scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10
hold on
gmPDF = @(x,y) arrayfun(@(x0,y0) pdf(gm,[x0 y0]),x,y);
fcontour(gmPDF,[-6 8 -4 6])
Разделите данные на кластеры путем передачи установленного GMM и данных в cluster.
idx = cluster(gm,X);
Использование gscatter для создания графика поля точек, сгруппированного по idx.
gm - Распределение Гауссовой смеси gmdistribution объект
Распределение Гауссова смеси, также называемое Смешанной гауссовской моделью (GMM), задается как gmdistribution объект.
Можно создать gmdistribution объект, использующий gmdistribution или fitgmdist. Используйте gmdistribution функция для создания gmdistribution объект путем определения параметров распределения. Используйте fitgmdist функция для соответствия gmdistribution модель к данным заданное фиксированное количество компонентов.
X - Данные n -by m числовая матрица
Данные, заданные как n -by m числовая матрица, где n - количество наблюдений, а m - количество переменных в каждом наблюдении.
Чтобы обеспечить значимые результаты кластеризации, X должен происходить из того же населения, что и данные, используемые для создания gm.
Если строка X содержит NaNs, затем cluster исключает строку из расчетов. Соответствующее значение в idx, P, logpdf, и d2 является NaN.
idx - Индекс кластера n -by-1 положительный целочисленный вектор
Индекс кластера, возвращенный как n -на-1 положительный целочисленный вектор, где n - количество наблюдений в X.
idx(i) - кластерный индекс наблюдения i и указывает Гауссову смешанную составляющую с наибольшей апостериорной вероятностью, учитывая наблюдение i.
nlogL - Отрицательная логарифмическая правдоподобность числовое значение
Отрицательное значение логарифмической правдоподобности Смешанной гауссовской модели gm учитывая данные X, возвращенный как числовое значение.
P - Апостериорная вероятность n -by k числовой вектор
Апостериорная вероятность каждого Гауссова компонента смеси в gm учитывая каждое наблюдение в X, возвращенный как n -by k числовой вектор, где n - количество наблюдений в X и k количество компонентов смеси в gm.
P(i,j) - апостериорная вероятность jКомпонент смеси Гауссов заданное наблюдение i, Вероятность (компонент j | наблюдения i).
logpdf - Логарифм расчетного PDF n -by-1 числовой вектор
Логарифм оцененного PDF, оцениваемый при каждом наблюдении в X, возвращенный как n -на 1 числовой вектор, где n - количество наблюдений в X.
logpdf(i) - логарифм предполагаемого PDF при наблюдении i. cluster функция вычисляет предполагаемый PDF, используя вероятность каждого компонента, заданную каждое наблюдение и вероятности компонента.
где L(Cj| O j) - вероятность компонента jзаданное наблюдение, и P(C j) является вероятностью наличия компонента j. cluster функция вычисляет термин правдоподобия при помощи многомерного нормального PDF jКомпонент смеси Гауссов, оцениваемый при наблюдении i. Вероятности компонента являются пропорциями смешения компонентов смеси, ComponentProportion свойство gm.
d2 - Квадратное расстояние Махаланобиса n -by k числовая матрица
Квадратное расстояние Махаланобиса каждого наблюдения в X каждому Гауссову компоненту смеси в gm, возвращенный как n -by k числовая матрица, где n - количество наблюдений в X и k количество компонентов смеси в gm.
d2(i,j) - квадратное расстояние наблюдения i на jКомпонент смеси Гауссов.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.