Односторонний многомерный анализ дисперсии
d = manova1(X,group)
d = manova1(X,group,alpha)
[d,p] = manova1(...)
[d,p,stats] = manova1(...)
d = manova1(X,group) выполняет односторонний многомерный анализ дисперсии (MANOVA) для сравнения многомерных средних столбцов X, сгруппированные по group. X является матрицей m-на-n значений данных, и каждая строка является вектором измерений по n переменным для одного наблюдения. group - группирующая переменная, определяемая как категориальная переменная, вектор, символьный массив, строковый массив или массив ячеек символьных векторов. Два наблюдения находятся в одной группе, если они имеют одно и то же значение в group массив. Наблюдения в каждой группе представляют выборку из популяции.
Функция возвращает dоценка размерности пространства, содержащего группу, означает. manova1 проверяет нулевую гипотезу о том, что средства каждой группы являются одним и тем же n-мерным многомерным вектором, и что любая разница наблюдается в образце X происходит из-за случайной случайности. Если d = 0, нет никаких доказательств, чтобы отвергнуть эту гипотезу. Если d = 1, то вы можете отклонить нулевую гипотезу на уровне 5%, но вы не можете отклонить гипотезу о том, что многовариантные средства лежат на одной линии. Аналогично, если d = 2 многомерное средство может лежать на одной плоскости в n-мерном пространстве, но не на одной линии.
d = manova1(X,group,alpha) дает контроль над уровнем значимости, alpha. Возвращаемое значение d будет наименьшим размером, имеющим p > alpha, где p является значением p для проверки того, лежат ли средства в пространстве этого измерения.
[d,p] = manova1(...) также возвращает pвектор p-значений для проверки, лежат ли средства в пространстве размерности 0, 1 и так далее. Наибольший возможный размер - это размер помещения или на единицу меньше числа групп. Существует один элемент p для каждого измерения до, но не включая, самого большого.
Если i-е p-значение близко к нулю, это ставит под сомнение гипотезу, что группа означает лежать на пространстве i-1 размерностей. Выбор критического p-значения для определения того, оценен ли результат статистически значимым, остается за исследователем и определяется значением входного аргумента alpha. Обычно объявляют результат значимым, если значение p меньше 0,05 или 0,01.
[d,p,stats] = manova1(...) также возвращает statsструктура, содержащая дополнительные результаты MANOVA. Структура содержит следующие поля.
| Область | Содержание |
|---|---|
W | Сумма квадратов и перекрестных произведений внутри групп |
B | Сумма квадратов между группами и матрица перекрестных произведений |
T | Общая сумма квадратов и матриц перекрестных произведений |
dfW | Степени свободы для |
dfB | Степени свободы для |
dfT | Степени свободы для |
lambda | Вектор значений статистики лямбда-тестов Уилкса для проверки того, имеют ли средства размерность 0, 1 и т.д. |
chisq | Преобразование |
chisqdf | Степени свободы для |
eigenval | Собственные значения W-1B |
eigenvec | Собственные векторы W-1B; это коэффициенты для канонических переменных |
canon | Канонические переменные |
mdist | Вектор расстояний Махаланобиса от каждой точки до среднего значения его группы |
gmdist | Матрица расстояний Махаланобиса между каждой парой групповых средств |
Канонические переменные C - линейные комбинации исходных переменных, выбранные для максимизации разделения между группами. В частности, C(:,1) - линейная комбинация X столбцы с максимальным разделением между группами. Это означает, что среди всех возможных линейных комбинаций это та, которая имеет наиболее значимую статистику F в одностороннем анализе дисперсии. C(:,2) имеет максимальное разделение при условии, что оно ортогонально C(:,1)и так далее.
Вы можете счесть полезным использовать выходные данные manova1 наряду с другими функциями, дополняющими анализ. Например, может потребоваться начать с сгруппированной матрицы графика рассеяния исходных переменных с помощью gplotmatrix. Вы можете использовать gscatter для визуализации разделения групп с использованием первых двух канонических переменных. Вы можете использовать manovacluster построить график дендрограммы, показывающей кластеры среди групповых средств.
Тест MANOVA делает следующие предположения о данных в X:
Популяции для каждой группы обычно распределены.
Матрица дисперсии-ковариации одинакова для каждой совокупности.
Все наблюдения взаимно независимы.
вы можете использовать manova1 определить, существуют ли различия в средних значениях четырех характеристик автомобилей среди групп, определяемых страной, в которой были изготовлены автомобили.
load carbig
[d,p] = manova1([MPG Acceleration Weight Displacement],...
Origin)
d =
3
p =
0
0.0000
0.0075
0.1934Во входной матрице имеется четыре измерения, поэтому групповые средства должны находиться в четырёхмерном пространстве. manova1 показывает, что нельзя отвергнуть гипотезу о том, что средства лежат в 3-D подпространстве.
[1] Кржановский, В. Дж. Принципы многомерного анализа: перспектива пользователя. Нью-Йорк: Oxford University Press, 1988.