Различные тесты гипотезы делают различные предположения о распределении случайной переменной, выбираемой в данных. Эти допущения должны быть учтены при выборе теста и при интерпретации результатов.
Например, z -test (ztest
) и t -тест (ttest
) оба предполагают, что данные независимо отбираются из нормального распределения. Для проверки этого предположения доступны функции Statistics and Machine Learning Toolbox™, такие как chi2gof
, jbtest
, lillietest
, и normplot
.
И z-test, и t-test относительно устойчивы относительно отклонений от этого предположения, пока n размера выборки достаточно велика. Оба теста вычисляют среднее значение выборки, который, по теореме Central Limit, имеет приблизительно нормальное распределение выборки со средним равным среднему μ населения, независимо от выбранного распределения населения.
Разница между z -test и t -test в предположении стандартного σ отклонения базового нормального распределения. A z -test принимает, что σ известно; a t -test не делает. В результате t -test должен вычислить оценочную s стандартного отклонения от выборки.
Статистика тестов для z -test и t -test, соответственно,
При нулевой гипотезе, что население распределено со средними μ, z-статик имеет стандартное нормальное распределение N (0,1). Под той же нулевой гипотезой t-статик имеет t распределение Стьюдента с n - 1 степенями свободы. Для небольших размеров выборки распределение t Стьюдента более плоское и широкое, чем N (0,1), что компенсирует снижение доверия в оценочной s. Однако когда размер выборки увеличивается, распределение t Стьюдента приближается к стандартному нормальному распределению, и эти два теста становятся по существу эквивалентными.
Знание распределения тестовой статистики при нулевой гипотезе позволяет точное вычисление p значений. Интерпретация значений p в контексте тестовых допущений позволяет провести критический анализ результатов теста.
Допущения, лежащие в основе тестов гипотезы Statistics and Machine Learning Toolbox, приведены на страницах с описанием для реализации функций.