manova1

Односторонний многомерный дисперсионный анализ

Синтаксис

d = manova1(X,group)
d = manova1(X,group,alpha)
[d,p] = manova1(...)
[d,p,stats] = manova1(...)

Описание

d = manova1(X,group) выполняет односторонний Многомерный Дисперсионный анализ (МАНОВА) для сравнения многомерных средних значений столбцов X, сгруппированного group. X является матрицей m на n значений данных, и каждая строка является вектором измерений на n переменных для одного наблюдения. group является группирующей переменной, заданной как категориальная переменная, вектор, символьный массив, массив строк или массив ячеек из символьных векторов. Два наблюдения находятся в той же группе, если у них есть то же значение в массиве group. Наблюдения в каждой группе представляют выборку от генеральной совокупности.

Функция возвращает d, оценку размерности пробела, содержащего средние значения группы. manova1 тестирует нулевую гипотезу, что средние значения каждой группы являются тем же n-мерным многомерным вектором, и что любое различие, наблюдаемое в демонстрационном X, происходит из-за случайного шанса. Если d = 0, нет никакого доказательства, чтобы отклонить ту гипотезу. Если d = 1, то можно отклонить нулевую гипотезу на 5%-м уровне, но вы не можете отклонить гипотезу, что многомерные средние значения лежат на той же строке. Точно так же, если d = 2 многомерные средние значения может лечь на ту же плоскость в n-мерном пространстве, но не на той же строке.

d = manova1(X,group,alpha) дает контроль уровня значения, alpha. d возвращаемого значения будет самой маленькой размерностью, имеющей p > alpha, где p является p - значение для тестирования, лежат ли средние значения на пробеле той размерности.

[d,p] = manova1(...) также возвращает p, вектор p - значения для тестирования, лежат ли средние значения на пробеле размерности 0, 1, и так далее. Самая большая размерность является или размерностью пробела или меньше, чем количество групп. Существует один элемент p для каждой размерности до, но не включая, самое большое.

Если ith p - значение является близким нулем, это подвергает сомнению гипотезу, что средние значения группы лежат на пробеле i-1 размерностей. Выбор критического p - значение, чтобы определить, оценен ли результат статистически значительный, оставляет исследователю и задает значение входного параметра alpha. Распространено объявить результат, значительный, если p - значение - меньше чем 0,05 или 0.01.

[d,p,stats] = manova1(...) также возвращает stats, структура, содержащая дополнительные результаты МАНОВОЙ. Структура содержит следующие поля.

Поле Содержимое
W

Сумма квадратов в группах и матрица векторных произведений

B

Сумма квадратов между группами и матрица векторных произведений

T

Полная сумма матрицы квадратов и векторных произведений

dfW

Степени свободы для W

dfB

Степени свободы для B

dfT

Степени свободы для T

lambda

Вектор значений lambda Вилка тестирует статистическую величину на тестирование, имеют ли средние значения размерность 0, 1, и т.д.

chisq

Преобразование lambda к аппроксимированному распределению хи-квадрат

chisqdf

Степени свободы для chisq

eigenval

Собственные значения W-1B

eigenvec

Собственные вектора W-1B; это коэффициенты для канонических переменных C, и они масштабируются так, отклонение в группе канонических переменных равняется 1

canon

Канонические переменные C, равные XC*eigenvec, где XC является X со столбцами, сосредоточенными путем вычитания их средних значений

mdist

Вектор расстояний Mahalanobis от каждой точки до среднего значения ее группы

gmdist

Матрица расстояний Mahalanobis между каждой парой средних значений группы

Канонические переменные C являются линейными комбинациями исходных переменных, выбранных, чтобы максимизировать разделение между группами. А именно, C(:,1) является линейной комбинацией столбцов X, которая имеет максимальное разделение между группами. Это означает, что среди всех возможных линейных комбинаций, это - то со старшей значащей статистической величиной F в одностороннем дисперсионном анализе. C(:,2) имеет максимальное разделение, подвергающееся ему являющийся ортогональным к C(:,1) и так далее.

Можно найти полезным использовать выходные параметры от manova1 наряду с другими функциями, чтобы добавить анализ. Например, можно хотеть запуститься со сгруппированной матрицы графика рассеивания исходных переменных с помощью gplotmatrix. Можно использовать gscatter, чтобы визуализировать разделение группы с помощью первых двух канонических переменных. Можно использовать manovacluster, чтобы изобразить в виде графика древовидную схему, показывающую кластеры среди средних значений группы.

Предположения

Тест МАНОВОЙ делает следующие предположения о данных в X:

  • Население для каждой группы нормально распределено.

  • Ковариационная матрица отклонения является тем же самым для каждой генеральной совокупности.

  • Все наблюдения взаимно независимы.

Примеры

можно использовать manova1, чтобы определить, существуют ли различия в средних значениях четырех автомобильных характеристик среди групп, заданных страной, где автомобили были сделаны.

load carbig
[d,p] = manova1([MPG Acceleration Weight Displacement],...
                Origin)
d =
   3
p =
     0
  0.0000
  0.0075
  0.1934

Во входной матрице существует четыре размерности, таким образом, средние значения группы должны лечь на четырехмерном пробеле. manova1 показывает, что вы не можете отклонить гипотезу, что средние значения лежат в 3-D подпространстве.

Ссылки

[1] Крзановский, W. J. Принципы многомерного анализа: перспектива пользователя. Нью-Йорк: Издательство Оксфордского университета, 1988.

Представлено до R2006a