Все проверку гипотезы имеют одинаковую базовую терминологию и структуру.
Нулевая гипотеза является утверждением о населении, которую вы хотели бы проверить. Это «null» в том смысле, что он часто представляет собой веру в статус-кво, такую как отсутствие характеристики или отсутствие эффекта. Это может быть формализовано путем утверждения, что параметр population, или комбинация параметров population, имеет определенное значение. В примере, приведенном в Hypothesis Testing, нулевая гипотеза заключалась бы в том, что средняя цена газа по всему состоянию составляла 1,15 доллара. Это записано H 0 : µ = 1,15.
Альтернативная гипотеза является контрастным утверждением о населении, которое может быть проверено против нулевой гипотезы. В примере, приведенном в Hypothesis Testing, возможными альтернативными гипотезами являются:
H 1: µ ≠ 1.15 - Средний показатель по штату отличался от $1.15 (двуххвостый тест)
H 1: µ > 1,15 - среднее значение состояния был больше 1,15 $ (правый хвостовой тест)
H 1: µ < 1,15 - среднее значение штата был менее 1,15 $ (левый хвостовой тест)
Чтобы провести проверку гипотезы, собирают случайную выборку из населения и вычисляют соответствующую тестовую статистику, чтобы суммировать выборку. Эта статистическая величина изменяется в зависимости от типа теста, но его распределение при нулевой гипотезе должно быть известно (или принято).
Значение p теста является вероятностью, согласно нулевой гипотезе, получения значения тестовой статистики как экстремального или более экстремального, чем значение, вычисленное из выборки.
Уровень значимости теста является порогом вероятности, с α согласуется перед проведением теста. Типичное значение α составляет 0,05. Если p значение теста меньше α, тест отклоняет гипотезу null. Если значение p больше α, недостаточно доказательств, чтобы отклонить нулевую гипотезу. Обратите внимание, что отсутствие доказательств отклонения нулевой гипотезы не является доказательством принятия нулевой гипотезы. Следует также отметить, что из статистической значимости теста нельзя сделать вывод о существенной «значимости» альтернативы.
α уровня значимости могут быть интерпретированы как вероятность отклонения нулевой гипотезы, когда она на самом деле верна - ошибка типа I. Распределение тестовой статистики при нулевой гипотезе определяет α вероятности ошибки типа I. Даже если нулевая гипотеза не отклонена, она все равно может быть ложной - ошибка типа II. Распределение тестовой статистики при альтернативной гипотезе определяет β вероятности ошибки типа II. Ошибки типа II часто связаны с небольшими размерами выборки. Степень теста, 1 - β, является вероятностью правильного отклонения ложной нулевой гипотезы.
Результаты тестов гипотезы часто сообщаются с доверием интервалом. Интервал доверия является оценочной областью значений значений с заданной вероятностью содержания истинного населения значения параметра. Верхняя и нижняя границы для интервалов доверия вычисляются из оценки выборки параметра и известного (или предполагаемого) распределения выборки оценщика. Типичное предположение состоит в том, что оценки обычно распределяются с повторной выборкой (как диктует теорема о центральном пределе). Более широкие доверительные интервалы соответствуют плохим оценкам (меньшие выборки); узкие интервалы соответствуют лучшим оценкам (большие выборки). Если гипотеза null утверждает значение параметра population, тест отклоняет гипотезу null, когда гипотезированное значение находится вне вычисленного доверительного интервала для параметра.