Тест Краскэл-Уоллиса
возвращает p - значение для нулевой гипотезы что данные в каждом столбце матричного p
= kruskalwallis(x
)x
прибывает из того же распределения, с помощью теста Краскэл-Уоллиса. Альтернативная гипотеза - то, что не все выборки прибывают из того же распределения. kruskalwallis
также возвращает таблицу ANOVA и диаграмму.
возвращает p - значение теста и позволяет вам отобразить или подавить таблицу ANOVA и диаграмму.p
= kruskalwallis(x
,group
,displayopt
)
Создайте два различных объекта нормального распределения вероятностей. Первое распределение имеет mu = 0
и sigma = 1
, и второе распределение имеет mu = 2
и sigma = 1
.
pd1 = makedist('Normal'); pd2 = makedist('Normal','mu',2,'sigma',1);
Создайте матрицу выборочных данных путем генерации случайных чисел от этих двух распределений.
rng('default'); % for reproducibility x = [random(pd1,20,2),random(pd2,20,1)];
Первые два столбца x
содержите данные, сгенерированные от первого распределения, в то время как третий столбец содержит данные, сгенерированные от второго распределения.
Протестируйте нулевую гипотезу что выборочные данные из каждого столбца в x
прибывает из того же распределения.
p = kruskalwallis(x)
p = 3.6896e-06
Возвращенное значение p
указывает на тот kruskalwallis
отклоняет нулевую гипотезу, что все три выборки данных прибывают из того же распределения на 1%-м уровне значения. Таблица ANOVA обеспечивает дополнительные результаты испытаний, и диаграмма визуально представляет итоговую статистику для каждого столбца в x
.
Создайте два различных объекта нормального распределения вероятностей. Первое распределение имеет mu = 0
и sigma = 1
. Второе распределение имеет mu = 2
и sigma = 1
.
pd1 = makedist('Normal'); pd2 = makedist('Normal','mu',2,'sigma',1);
Создайте матрицу выборочных данных путем генерации случайных чисел от этих двух распределений.
rng('default'); % for reproducibility x = [random(pd1,20,2),random(pd2,20,1)];
Первые два столбца x
содержите данные, сгенерированные от первого распределения, в то время как третий столбец содержит данные, сгенерированные от второго распределения.
Протестируйте нулевую гипотезу что выборочные данные из каждого столбца в x
прибывает из того же распределения. Подавите выходные отображения и сгенерируйте структуру stats
использовать в дальнейшем тестировании.
[p,tbl,stats] = kruskalwallis(x,[],'off')
p = 3.6896e-06
tbl=4×6 cell array
Columns 1 through 5
{'Source' } {'SS' } {'df'} {'MS' } {'Chi-sq' }
{'Columns'} {[7.6311e+03]} {[ 2]} {[3.8155e+03]} {[ 25.0200]}
{'Error' } {[1.0364e+04]} {[57]} {[ 181.8228]} {0x0 double}
{'Total' } {[ 17995]} {[59]} {0x0 double } {0x0 double}
Column 6
{'Prob>Chi-sq'}
{[ 3.6896e-06]}
{0x0 double }
{0x0 double }
stats = struct with fields:
gnames: [3x1 char]
n: [20 20 20]
source: 'kruskalwallis'
meanranks: [26.7500 18.9500 45.8000]
sumt: 0
Возвращенное значение p
указывает, что тест отклоняет нулевую гипотезу на 1%-м уровне значения. Можно использовать структуру stats
выполнять дополнительное последующее тестирование. Массив ячеек tbl
содержит те же данные как графическая таблица ANOVA, включая метки строки и столбец.
Проведите последующий тест, чтобы идентифицировать, какая выборка данных прибывает из различного распределения.
c = multcompare(stats)
Note: Intervals can be used for testing but are not simultaneous confidence intervals.
c = 3×6
1.0000 2.0000 -5.1435 7.8000 20.7435 0.3345
1.0000 3.0000 -31.9935 -19.0500 -6.1065 0.0016
2.0000 3.0000 -39.7935 -26.8500 -13.9065 0.0000
Результаты показывают, что существует значительная разница между группами 1 и 3, таким образом, тест отклоняет нулевую гипотезу, что данные в этих двух группах прибывают из того же распределения. То же самое верно для групп 2 и 3. Однако между группами 1 и 2 нет значительной разницы, таким образом, тест не отклоняет нулевую гипотезу, что эти две группы происходят из того же распределения. Поэтому эти результаты предлагают, чтобы данные в группах 1 и 2 прибыли из того же распределения, и данные в группе 3 прибывают из различного распределения.
Создайте вектор, strength
, содержа измерения силы металлических лучей. Создайте второй вектор, alloy
, указание на тип металлического сплава, из которого сделан соответствующий луч.
strength = [82 86 79 83 84 85 86 87 74 82 ... 78 75 76 77 79 79 77 78 82 79]; alloy = {'st','st','st','st','st','st','st','st',... 'al1','al1','al1','al1','al1','al1',... 'al2','al2','al2','al2','al2','al2'};
Протестируйте нулевую гипотезу, что измерения силы луча имеют то же распределение через все три сплава.
p = kruskalwallis(strength,alloy,'off')
p = 0.0018
Возвращенное значение p
указывает, что тест отклоняет нулевую гипотезу на 1%-м уровне значения.
x
— Выборочные данныеВыборочные данные для гипотезы тестируют в виде вектора или m-by-n матрицу. Если x
m-by-n матрица, каждый из столбцов n представляет независимую выборку, содержащую m взаимно независимые наблюдения.
Типы данных: single
| double
group
— Сгруппированная переменнаяСгруппированная переменная в виде числового или логического вектора, символьного массива или массива строк или массива ячеек из символьных векторов.
Если x
вектор, затем каждый элемент в group
идентифицирует группу к который соответствующий элемент в x
принадлежит, и group
должен быть вектор из той же длины как x
. Если строка group
содержит пустое значение, ту строку и соответствующее наблюдение в x
игнорируются. NaN
значения в любом x
или group
так же проигнорированы.
Если x
матрица, затем каждый столбец в x
представляет другую группу, и можно использовать group
задавать метки для этих столбцов. Число элементов в group
и количество столбцов в x
должно быть равным.
Метки содержатся в group
также аннотируйте диаграмму.
Пример: {'red','blue','green','blue','red','blue','green','green','red'}
Типы данных: single
| double
| logical
| char
| string
| cell
displayopt
— Параметр отображения'on'
(значение по умолчанию) | 'off'
Параметр отображения в виде 'on'
или 'off'
. Если displayopt
'on'
, kruskalwallis
отображения следующие фигуры:
Таблица ANOVA, содержащая суммы квадратов, степени свободы и другие количества, вычисленные на основе рангов данных в x
.
Диаграмма данных в каждом столбце матрицы данных x
. Диаграммы основаны на фактических значениях данных, а не на рангах.
Если displayopt
'off'
, kruskalwallis
не отображает эти фигуры.
Если вы задаете значение для displayopt
, необходимо также задать значение для group
. Если у вас нет сгруппированной переменной, задайте group
как []
.
Пример: 'off'
p
— p - значениеp- теста, возвращенного как скалярное значение в области значений [0,1]. p
вероятность наблюдения тестовой статистической величины как экстремальное значение как, или более экстремальный, чем, наблюдаемая величина по нулевой гипотезе. Маленькие значения p
подвергните сомнению валидность нулевой гипотезы.
tbl
— Таблица ANOVAТаблица ANOVA результатов испытаний, возвращенных как массив ячеек. tbl
включает суммы квадратов, степени свободы и другие количества, вычисленные на основе рангов данных в x
, а также столбец и метки строки.
stats
— Тестовые данныеТестовые данные, возвращенные как структура. Можно выполнить последующую обработку и анализ несколько тестов сравнения на парах демонстрационных медиан при помощи multcompare
, с stats
как входное значение.
Тест Краскэл-Уоллиса является непараметрической версией классического однофакторного дисперсионного анализа и расширением теста суммы ранга Wilcoxon больше чем двум группам. Тест Краскэл-Уоллиса допустим для данных, которые имеют две или больше группы. Это сравнивает медианы групп данных в x
определить, прибывают ли выборки из того же населения (или, эквивалентно, из различных популяций с тем же распределением).
Тест Краскэл-Уоллиса использует ранги данных, а не числовые значения, чтобы вычислить тестовую статистику. Это находит ранги путем упорядоченного расположения данных от самого маленького до самого большого через все группы и взятия числового индекса этого упорядоченного расположения. Ранг для связанного наблюдения равен среднему рангу всех наблюдений, сыграл вничью с ним. F-статистическая-величина, используемая в классическом однофакторном дисперсионном анализе, заменяется статистической величиной хи-квадрата, и p-значение измеряет значение статистической величины хи-квадрата.
Тест Краскэл-Уоллиса принимает, что все выборки прибывают из популяций, имеющих то же непрерывное распределение кроме возможно других мест из-за эффектов группы, и что все наблюдения взаимно независимы. В отличие от этого, классический однофакторный дисперсионный анализ заменяет первое предположение на более сильное предположение, что у популяций есть нормальные распределения.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.