Расстояние Mahalanobis
возвращает расстояние Mahalanobis в квадрате каждого наблюдения в d2
= mahal(Y
,X
)Y
к ссылочным выборкам в X
.
Сгенерируйте коррелированый набор данных двумерной выборки.
rng('default') % For reproducibility X = mvnrnd([0;0],[1 .9;.9 1],1000);
Задайте четыре наблюдения, которые являются равноотстоящими от среднего значения X
в Евклидовом расстоянии.
Y = [1 1;1 -1;-1 1;-1 -1];
Вычислите расстояние Mahalanobis каждого наблюдения в Y
к ссылочным выборкам в X
.
d2_mahal = mahal(Y,X)
d2_mahal = 4×1
1.1095
20.3632
19.5939
1.0137
Вычислите Евклидово расстояние в квадрате каждого наблюдения в Y
от среднего значения X
.
d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1
2.0931
2.0399
1.9625
1.9094
Постройте X
и Y
при помощи scatter
и используйте цвет маркера, чтобы визуализировать расстояние Mahalanobis Y
к ссылочным выборкам в X
.
scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10 hold on scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled') hb = colorbar; ylabel(hb,'Mahalanobis Distance') legend('X','Y','Location','best')
Все наблюдения в Y
([1,1] , [-1,-1,]
, [1,-1]
, и
[-1,1]
) являются равноотстоящими от среднего значения X
в Евклидовом расстоянии. Однако [1,1]
и [-1,-1]
намного ближе к X, чем [1,-1]
и [-1,1]
в расстоянии Mahalanobis. Поскольку расстояние Mahalanobis рассматривает ковариацию данных и шкалы различных переменных, это полезно для обнаружения выбросов.
Y
данныеДанные, заданные как n-by-m числовая матрица, где n является количеством наблюдений и m, являются количеством переменных в каждом наблюдении.
X
и Y
должен иметь одинаковое число столбцов, но может иметь различные количества строк.
Типы данных: single
| double
X
— Ссылочные выборкиСсылочные выборки, заданные как p-by-m числовая матрица, где p является количеством выборок и m, являются количеством переменных в каждой выборке.
X
и Y
должен иметь одинаковое число столбцов, но может иметь различные количества строк. X
должен иметь больше строк, чем столбцы.
Типы данных: single
| double
d2
— Расстояние Mahalanobis в квадратеРасстояние Mahalanobis в квадрате каждого наблюдения в Y
к ссылочным выборкам в X
, возвращенный как n-by-1 числовой вектор, где n является количеством наблюдений в X
.
Расстояние Mahalanobis является мерой между точкой выборки и распределением.
Расстояние Mahalanobis от векторного y до распределения со средним μ и ковариацией Σ
Это расстояние представляет, как далеко y от среднего значения в количестве стандартных отклонений.
mahal
возвращает расстояние Mahalanobis в квадрате d 2 от наблюдения в Y
к ссылочным выборкам в X
. В mahal
функция, μ и Σ являются демонстрационным средним значением и ковариацией ссылочных выборок, соответственно.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.