Расстояние Mahalanobis
возвращает расстояние Mahalanobis в квадрате каждого наблюдения в d2 = mahal(Y,X)Y к ссылочным выборкам в X.
Сгенерируйте коррелированый набор данных двумерной выборки.
rng('default') % For reproducibility X = mvnrnd([0;0],[1 .9;.9 1],1000);
Задайте четыре наблюдения, которые являются равноотстоящими от среднего значения X в Евклидовом расстоянии.
Y = [1 1;1 -1;-1 1;-1 -1];
Вычислите расстояние Mahalanobis каждого наблюдения в Y к ссылочным выборкам в X.
d2_mahal = mahal(Y,X)
d2_mahal = 4×1
1.1095
20.3632
19.5939
1.0137
Вычислите Евклидово расстояние в квадрате каждого наблюдения в Y от среднего значения X .
d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1
2.0931
2.0399
1.9625
1.9094
Постройте X и Y при помощи scatter и используйте цвет маркера, чтобы визуализировать расстояние Mahalanobis Y к ссылочным выборкам в X.
scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10 hold on scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled') hb = colorbar; ylabel(hb,'Mahalanobis Distance') legend('X','Y','Location','best')

Все наблюдения в Y([1,1] , [-1,-1,], [1,-1], и [-1,1]) являются равноотстоящими от среднего значения X в Евклидовом расстоянии. Однако [1,1] и [-1,-1] намного ближе к X, чем [1,-1] и [-1,1] в расстоянии Mahalanobis. Поскольку расстояние Mahalanobis рассматривает ковариацию данных и шкалы различных переменных, это полезно для обнаружения выбросов.
Y данныеДанные в виде n-by-m числовая матрица, где n является количеством наблюдений и m, являются количеством переменных в каждом наблюдении.
X и Y должен иметь одинаковое число столбцов, но может иметь различные количества строк.
Типы данных: single | double
X — Ссылочные выборкиСсылочные выборки в виде p-by-m числовая матрица, где p является количеством выборок и m, являются количеством переменных в каждой выборке.
X и Y должен иметь одинаковое число столбцов, но может иметь различные количества строк. X должен иметь больше строк, чем столбцы.
Типы данных: single | double
d2 — Расстояние Mahalanobis в квадратеРасстояние Mahalanobis в квадрате каждого наблюдения в Y к ссылочным выборкам в X, возвращенный как n-by-1 числовой вектор, где n является количеством наблюдений в X.
Расстояние Mahalanobis является мерой между точкой выборки и распределением.
Расстояние Mahalanobis от векторного y до распределения со средним μ и ковариацией Σ
Это расстояние представляет, как далеко y от среднего значения в количестве стандартных отклонений.
mahal возвращает расстояние Mahalanobis в квадрате d 2 от наблюдения в Y к ссылочным выборкам в X. В mahal функция, μ и Σ являются демонстрационным средним значением и ковариацией ссылочных выборок, соответственно.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.