exponenta event banner

Допущения проверки гипотез

Различные тесты гипотез делают различные предположения о распределении случайной величины, отбираемой в данных. Эти допущения должны учитываться при выборе теста и при интерпретации результатов.

Например, z-тест (ztestи t-тест (ttest) оба предполагают, что данные независимо дискретизируются из нормального распределения. Для тестирования этого предположения доступны функции статистики и Toolbox™ машинного обучения, такие как chi2gof, jbtest, lillietest, и normplot.

И z-тест, и t-тест относительно устойчивы по отношению к отклонениям от этого предположения, пока размер выборки n достаточно велик. В обоих тестах вычисляется среднее значение выборки x =, которое, согласно Центральной предельной теореме, имеет приблизительно нормальное распределение выборки со средним значением, равным среднему значению для популяции, независимо от выборочного распределения популяции.

Разница между z-тестом и t-тестом заключается в предположении о стандартном отклонении Z-тест предполагает, что λ известен; t-тест означает, что в результате t-тест должен вычислить оценку s стандартного отклонения от выборки.

Статистика испытаний для z-теста и t-теста, соответственно,

z = x

При нулевой гипотезе о том, что популяция распределена со средним, z-статистика имеет стандартное нормальное распределение, N (0,1). При той же нулевой гипотезе t-статистика имеет t-распределение Стьюдента с n - 1 степенями свободы. Для небольших размеров выборки распределение t Стьюдента более плоское и более широкое, чем N (0,1), компенсируя пониженную уверенность в оценке. Однако по мере увеличения размера выборки распределение t Стьюдента приближается к стандартному нормальному распределению, и два теста становятся по существу эквивалентными.

Знание распределения проверочной статистики при нулевой гипотезе позволяет точно вычислить p-значения. Интерпретация значений p в контексте допущений теста позволяет проводить критический анализ результатов теста.

Допущения, лежащие в основе тестов гипотез Statistics и Machine Learning Toolbox, приведены на справочных страницах для реализации функций.

Связанные темы