mahal

Расстояние Mahalanobis

Синтаксис

Описание

пример

d2 = mahal(Y,X) возвращает расстояние Mahalanobis в квадрате каждого наблюдения в Y к ссылочным выборкам в X.

Примеры

свернуть все

Сгенерируйте коррелированый набор данных двумерной выборки.

rng('default') % For reproducibility
X = mvnrnd([0;0],[1 .9;.9 1],1000);

Задайте четыре наблюдения, которые являются равноотстоящими от среднего значения X в Евклидовом расстоянии.

Y = [1 1;1 -1;-1 1;-1 -1];

Вычислите расстояние Mahalanobis каждого наблюдения в Y к ссылочным выборкам в X.

d2_mahal = mahal(Y,X)
d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

Вычислите Евклидово расстояние в квадрате каждого наблюдения в Y от среднего значения X .

d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

Постройте X и Y при помощи scatter и используйте цвет маркера, чтобы визуализировать расстояние Mahalanobis Y к ссылочным выборкам в X.

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10
hold on
scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled')
hb = colorbar;
ylabel(hb,'Mahalanobis Distance')
legend('X','Y','Location','best')

Все наблюдения в Y([1,1] , [-1,-1,], [1,-1], и [-1,1]) являются равноотстоящими от среднего значения X в Евклидовом расстоянии. Однако [1,1] и [-1,-1] намного ближе к X, чем [1,-1] и [-1,1] в расстоянии Mahalanobis. Поскольку расстояние Mahalanobis рассматривает ковариацию данных и шкалы различных переменных, это полезно для обнаружения выбросов.

Входные параметры

свернуть все

Данные в виде n-by-m числовая матрица, где n является количеством наблюдений и m, являются количеством переменных в каждом наблюдении.

X и Y должен иметь одинаковое число столбцов, но может иметь различные количества строк.

Типы данных: single | double

Ссылочные выборки в виде p-by-m числовая матрица, где p является количеством выборок и m, являются количеством переменных в каждой выборке.

X и Y должен иметь одинаковое число столбцов, но может иметь различные количества строк. X должен иметь больше строк, чем столбцы.

Типы данных: single | double

Выходные аргументы

свернуть все

Расстояние Mahalanobis в квадрате каждого наблюдения в Y к ссылочным выборкам в X, возвращенный как n-by-1 числовой вектор, где n является количеством наблюдений в X.

Больше о

свернуть все

Расстояние Mahalanobis

Расстояние Mahalanobis является мерой между точкой выборки и распределением.

Расстояние Mahalanobis от векторного y до распределения со средним μ и ковариацией Σ

d=(yμ)1(yμ)'.

Это расстояние представляет, как далеко y от среднего значения в количестве стандартных отклонений.

mahal возвращает расстояние Mahalanobis в квадрате d 2 от наблюдения в Y к ссылочным выборкам в X. В mahal функция, μ и Σ являются демонстрационным средним значением и ковариацией ссылочных выборок, соответственно.

Смотрите также

|

Представлено до R2006a