Расстояние Махаланобиса
возвращает квадратное расстояние Махаланобиса каждого наблюдения в d2
= mahal(Y
,X
)Y
к эталонным выборкам в X
.
Сгенерируйте коррелированный двухмерный набор выборочных данных.
rng('default') % For reproducibility X = mvnrnd([0;0],[1 .9;.9 1],1000);
Задайте четыре наблюдения, которые равноудалены от среднего значения X
в евклидовом расстоянии.
Y = [1 1;1 -1;-1 1;-1 -1];
Вычислите расстояние Махаланобиса каждого наблюдения в Y
к эталонным выборкам в X
.
d2_mahal = mahal(Y,X)
d2_mahal = 4×1
1.1095
20.3632
19.5939
1.0137
Вычислите квадратное евклидово расстояние каждого наблюдения в Y
от среднего значения X
.
d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1
2.0931
2.0399
1.9625
1.9094
График X
и Y
при помощи scatter
и используйте цвет маркера, чтобы визуализировать расстояние Махаланобиса Y
к эталонным выборкам в X
.
scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10 hold on scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled') hb = colorbar; ylabel(hb,'Mahalanobis Distance') legend('X','Y','Location','best')
Все наблюдения в Y
([1,1]
, [-1,-1,]
, [1,-1]
, и [-1,1]
) равноудалены от среднего значения X
в евклидовом расстоянии. Однако [1,1]
и [-1,-1]
намного ближе к X, чем [1,-1]
и [-1,1]
на расстоянии Махаланобиса. Поскольку расстояние Махаланобиса рассматривает ковариацию данных и шкалы различных переменных, это полезно для обнаружения выбросов.
Y
- ДанныеДанные, заданные как n -by m числовая матрица, где n - количество наблюдений, а m - количество переменных в каждом наблюдении.
X
и Y
должен иметь одинаковое число столбцов, но может иметь разное количество строк.
Типы данных: single
| double
X
- Эталонные выборкиСсылочные выборки, заданные как p -by m числовая матрица, где p - количество выборок, а m - количество переменных в каждой выборке.
X
и Y
должен иметь одинаковое число столбцов, но может иметь разное количество строк. X
должно иметь больше строк, чем столбцов.
Типы данных: single
| double
d2
- Квадратное расстояние МахаланобисаКвадратное расстояние Махаланобиса каждого наблюдения в Y
к эталонным выборкам в X
, возвращенный как n -на 1 числовой вектор, где n - количество наблюдений в X
.
Расстояние Махаланобиса является мерой между точкой выборки и распределением.
Расстояние Махаланобиса от вектора y до распределения со средним μ и ковариацией Σ является
Это расстояние представляет, насколько y расстояние от среднего по количеству стандартных отклонений.
mahal
возвращает квадратное расстояние Махаланобиса d2 из наблюдения в Y
к эталонным выборкам в X
. В mahal
функция, μ и Σ являются средним значением выборки и ковариацией эталонных выборок, соответственно.
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.