chi2gof

Тест пригодности хи-квадрат

свернуть все на странице

Синтаксис

h = chi2gof (x)

h = chi2gof (x, имя, значение)

[h, p] = chi2gof (___)

[h, p, stats] = chi2gof (___)

Описание

пример

h = chi2gof(x) возвращает тестовое решение для нулевой гипотезы, что данные в векторе x происходит из нормального распределения со средним и отклонением, оцененным из x, используя тест пригодности хи-квадрат. Альтернативная гипотеза заключается в том, что данные не исходят из такого распределения. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне значимости 5%, и 0 в противном случае.

пример

h = chi2gof(x,Name,Value) Возвращает тестовое решение для теста хи-квадрат goodness-of-fit с дополнительными опциями, заданными одним или несколькими аргументами пары имя-значение. Например, можно проверить распределение, отличное от обычного, или изменить уровень значимости теста.

пример

[h,p] = chi2gof(___) также возвращает значение p p теста гипотезы, используя любой из входных аргументов из предыдущих синтаксисов.

пример

[h,p,stats] = chi2gof(___) также возвращает структуру stats, содержащий информацию о статистике теста.

Примеры

свернуть все

Проверка нормального распределения

Открыть сценарий в реальном времени

Создайте стандартный нормальный объект распределения вероятностей. Создание вектора данных x используя случайные числа из распределения.

pd = makedist('Normal');
rng default;  % for reproducibility
x = random(pd,100,1);

Проверьте нулевую гипотезу, что данные в x происходит от населения с нормальным распределением.

h = chi2gof(x)

h = 0

Возвращенное значение h = 0 указывает, что chi2gof не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Тестовая гипотеза на разном уровне значимости

Открыть сценарий в реальном времени

pd = makedist('Normal');
rng default;  % for reproducibility
x = random(pd,100,1);

Проверьте нулевую гипотезу, что данные в x происходит от населения с нормальным распределением на уровне значимости 1%.

[h,p] = chi2gof(x,'Alpha',0.01)

h = 0

p = 0.3775

Возвращенное значение h = 0 указывает, что chi2gof не отвергает нулевую гипотезу на уровне значимости 1%.

Проверка распределения Вейбулла с использованием объекта распределения вероятностей

Открыть сценарий в реальном времени

Загрузите образец срока службы лампочки.

load lightbulb

Создайте вектор из первого столбца матрицы данных, который содержит срок службы лампочек в часах.

x = lightbulb(:,1);

Проверьте нулевую гипотезу, что данные в x происходит от населения с распределением Вейбулла. Использовать fitdist для создания объекта распределения вероятностей с помощью A и B параметры, оцененные по данным.

pd = fitdist(x,'Weibull');
h = chi2gof(x,'CDF',pd)

h = 1

Возвращенное значение h = 1 указывает, что chi2gof отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Тест для распределения Пуассона

Открыть сценарий в реальном времени

Создайте шесть ячеек с номерами от 0 до 5 для использования в пуле данных.

bins = 0:5;

Создайте вектор, содержащий наблюдаемые счетчики для каждой ячейки, и вычислите общее количество наблюдений.

obsCounts = [6 16 10 12 4 2];
n = sum(obsCounts);

Поместите объект распределения вероятности Пуассона в данные и вычислите ожидаемое число для каждого элемента. Использовать оператор транспонирования .' преобразовать bins и obsCounts от векторов строк к векторам столбцов.

pd = fitdist(bins','Poisson','Frequency',obsCounts');
expCounts = n * pdf(pd,bins);

Проверьте нулевую гипотезу, что данные в obsCounts происходит из распределения Пуассона с лямбда-параметром, равным lambdaHat.

[h,p,st] = chi2gof(bins,'Ctrs',bins,...
                        'Frequency',obsCounts, ...
                        'Expected',expCounts,...
                        'NParams',1)

h = 0

p = 0.4654

st = struct with fields:
    chi2stat: 2.5550
          df: 3
       edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000]
           O: [6 16 10 12 6]
           E: [7.0429 13.8041 13.5280 8.8383 6.0284]

Возвращенное значение h = 0 указывает, что chi2gof не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%. Вектор E содержит ожидаемые счетчики для каждого bin при нулевой гипотезе, и O содержит наблюдаемые счетчики для каждой ячейки.

Проверка нормального распределения с использованием дескриптора функции

Открыть сценарий в реальном времени

Использовать функцию распределения вероятностей normcdf в качестве дескриптора функции в тесте пригодности хи-квадрат (chi2gof).

Проверка нулевой гипотезы о том, что данные выборки во входном векторе x происходит от нормального распределения, при котором параметрыmean) и стандартное отклонение (std) данных выборки, соответственно.

rng('default') % For reproducibility
x = normrnd(50,5,100,1);
h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})

h = 0

Возвращенный результат h = 0 указывает, что chi2gof не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Входные аргументы

свернуть все

`x` - Образцы данных
вектор

Образец данных для проверки гипотезы, указанный как вектор.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'NBins',8,'Alpha',0.01 объединяет данные в восемь ячеек и проводит тест гипотезы на уровне значимости 1%.

`'NBins'` - Количество ячеек
`10` (по умолчанию) | положительное целое значение

Количество ячеек для использования в пуле данных, указанное как разделенная запятыми пара, состоящая из 'NBins' и положительное целое значение. Если указано значение для NBins, не указывайте значение для Ctrs или Edges.

Пример: 'NBins',8