exponenta event banner

mahal

Расстояние Махаланобиса

Синтаксис

Описание

пример

d2 = mahal(Y,X) возвращает квадрат расстояния Махаланобиса для каждого наблюдения в Y к эталонным образцам в X.

Примеры

свернуть все

Создайте коррелированный двухмерный набор данных выборки.

rng('default') % For reproducibility
X = mvnrnd([0;0],[1 .9;.9 1],1000);

Укажите четыре наблюдения, равноудаленные от среднего значения X на евклидовом расстоянии.

Y = [1 1;1 -1;-1 1;-1 -1];

Вычислите расстояние Махаланобиса для каждого наблюдения в Y к эталонным образцам в X.

d2_mahal = mahal(Y,X)
d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

Вычислите квадрат евклидова расстояния каждого наблюдения в Y от среднего значения X .

d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

График X и Y с помощью scatter и использовать цвет маркера для визуализации расстояния Махаланобиса Y к эталонным образцам в X.

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10
hold on
scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled')
hb = colorbar;
ylabel(hb,'Mahalanobis Distance')
legend('X','Y','Location','best')

Figure contains an axes. The axes contains 2 objects of type scatter. These objects represent X, Y.

Все наблюдения в Y ([1,1], [-1,-1,], [1,-1], и [-1,1]) равноудалены от среднего значения X на евклидовом расстоянии. Однако [1,1] и [-1,-1] гораздо ближе к X, чем [1,-1] и [-1,1] на расстоянии Махаланобиса. Поскольку расстояние Махаланобиса учитывает ковариацию данных и масштабы различных переменных, оно полезно для обнаружения отклонений.

Входные аргументы

свернуть все

Данные, определенные как n-by-m числовая матрица, где n - количество наблюдений, а m - количество переменных в каждом наблюдении.

X и Y должен иметь одинаковое количество столбцов, но может иметь разное количество строк.

Типы данных: single | double

Эталонные выборки, определенные как p-по-m числовая матрица, где p - количество выборок, а m - количество переменных в каждой выборке.

X и Y должен иметь одинаковое количество столбцов, но может иметь разное количество строк. X должно содержать больше строк, чем столбцов.

Типы данных: single | double

Выходные аргументы

свернуть все

Квадрат расстояния Махаланобиса каждого наблюдения в Y к эталонным образцам в X, возвращенный в виде n-by-1 числового вектора, где n - количество наблюдений в X.

Подробнее

свернуть все

Расстояние Махаланобиса

Расстояние Махаланобиса является мерой между точкой выборки и распределением.

Расстояние Махаланобиса от вектора y до распределения со средним λ, а ковариация Λ равна

d = (y−μ) −1 (y−μ) '.

Это расстояние представляет, насколько y находится от среднего по числу стандартных отклонений.

mahal возвращает квадрат расстояния Махаланобиса d2 от наблюдения в Y к эталонным образцам в X. В mahal function, λ и Λ - среднее значение выборки и ковариация эталонных образцов соответственно.

См. также

|

Представлен до R2006a