Расстояние Махаланобиса
возвращает квадрат расстояния Махаланобиса для каждого наблюдения в d2 = mahal(Y,X)Y к эталонным образцам в X.
Создайте коррелированный двухмерный набор данных выборки.
rng('default') % For reproducibility X = mvnrnd([0;0],[1 .9;.9 1],1000);
Укажите четыре наблюдения, равноудаленные от среднего значения X на евклидовом расстоянии.
Y = [1 1;1 -1;-1 1;-1 -1];
Вычислите расстояние Махаланобиса для каждого наблюдения в Y к эталонным образцам в X.
d2_mahal = mahal(Y,X)
d2_mahal = 4×1
1.1095
20.3632
19.5939
1.0137
Вычислите квадрат евклидова расстояния каждого наблюдения в Y от среднего значения X .
d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1
2.0931
2.0399
1.9625
1.9094
График X и Y с помощью scatter и использовать цвет маркера для визуализации расстояния Махаланобиса Y к эталонным образцам в X.
scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10 hold on scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled') hb = colorbar; ylabel(hb,'Mahalanobis Distance') legend('X','Y','Location','best')

Все наблюдения в Y ([1,1], [-1,-1,], [1,-1], и [-1,1]) равноудалены от среднего значения X на евклидовом расстоянии. Однако [1,1] и [-1,-1] гораздо ближе к X, чем [1,-1] и [-1,1] на расстоянии Махаланобиса. Поскольку расстояние Махаланобиса учитывает ковариацию данных и масштабы различных переменных, оно полезно для обнаружения отклонений.
Y - ДанныеДанные, определенные как n-by-m числовая матрица, где n - количество наблюдений, а m - количество переменных в каждом наблюдении.
X и Y должен иметь одинаковое количество столбцов, но может иметь разное количество строк.
Типы данных: single | double
X - Эталонные образцыЭталонные выборки, определенные как p-по-m числовая матрица, где p - количество выборок, а m - количество переменных в каждой выборке.
X и Y должен иметь одинаковое количество столбцов, но может иметь разное количество строк. X должно содержать больше строк, чем столбцов.
Типы данных: single | double
d2 - Расстояние Махаланобис в квадратеКвадрат расстояния Махаланобиса каждого наблюдения в Y к эталонным образцам в X, возвращенный в виде n-by-1 числового вектора, где n - количество наблюдений в X.
Расстояние Махаланобиса является мерой между точкой выборки и распределением.
Расстояние Махаланобиса от вектора y до распределения со средним λ, а ковариация Λ равна
(y−μ) '.
Это расстояние представляет, насколько y находится от среднего по числу стандартных отклонений.
mahal возвращает квадрат расстояния Махаланобиса d2 от наблюдения в Y к эталонным образцам в X. В mahal function, λ и Λ - среднее значение выборки и ковариация эталонных образцов соответственно.
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.