Все тесты гипотезы совместно используют ту же основную терминологию и структуру.
Нулевая гипотеза является утверждением о генеральной совокупности, что требуется протестировать. Это является “пустым” в том смысле, что это часто представляет веру статус-кво, такую как отсутствие характеристики или отсутствие эффекта. Это может быть формализовано путем утверждения, что параметр генеральной совокупности или комбинация параметров генеральной совокупности, имеет определенное значение. В примере, данном в Тестировании Гипотезы, нулевая гипотеза была бы то, что средняя стоимость газа через состояние составляла 1,15$. Это - записанный H 0: µ = 1.15.
Альтернативная гипотеза является контрастирующим утверждением о генеральной совокупности, которая может быть протестирована против нулевой гипотезы. В примере, данном в Тестировании Гипотезы, возможные альтернативные гипотезы:
H 1: µ ≠ 1.15 — среднее значение состояния отличался от 1,15$ (двусторонний тест)
H 1: µ> 1.15 — среднее значение состояния был больше, чем 1,15$ (тест правильного хвоста)
H 1: µ <1.15 — среднее значение состояния составлял меньше чем 1,15$ (тест лево-хвоста)
Чтобы провести тест гипотезы, случайная выборка от генеральной совокупности собрана, и соответствующая тестовая статистическая величина вычисляется, чтобы обобщить выборку. Эта статистическая величина меняется в зависимости от типа теста, но его распределение по нулевой гипотезе должно быть известно (или принято).
P значение теста является вероятностью, по нулевой гипотезе, получения значения тестовой статистической величины как экстремальное значение или более экстремальный, чем значение, вычисленное из выборки.
Уровень значения теста является порогом вероятности α, согласованный на то, прежде чем тест будет проведен. Типичное значение α 0.05. Если значение p теста является меньше, чем α, тест отклоняет нулевую гипотезу. Если p значение больше, чем α, существуют недостаточные доказательства, чтобы отклонить нулевую гипотезу. Обратите внимание на то, что отсутствие доказательства для отклонения нулевой гипотезы не является доказательством для принятия нулевой гипотезы. Также обратите внимание, что независимое “значение” альтернативы не может быть выведено из статистического значения теста.
α уровня значения может быть интерпретирован как вероятность отклонения нулевой гипотезы, когда это на самом деле верно — ошибка типа I. Распределение тестовой статистической величины по нулевой гипотезе определяет вероятность α ошибки типа I. Даже если нулевая гипотеза не отклоняется, это может все еще быть ложным — ошибка типа II. Распределение тестовой статистической величины в соответствии с альтернативной гипотезой определяет вероятность β ошибки типа II. Ошибки типа II часто происходят из-за размеров небольшой выборки. Степень теста, 1 – β, является вероятностью правильного отклонения ложной нулевой гипотезы.
Результаты тестов гипотезы часто передаются с доверительным интервалом. Доверительный интервал является предполагаемой областью значений значений с заданной вероятностью содержания истинного значения генеральной совокупности параметра. Верхние и нижние границы для доверительных интервалов вычислены из демонстрационной оценки параметра и известного (или приняты), выборка распределения средства оценки. Типичное предположение - то, что оценки будут нормально распределены с повторной выборкой (как продиктовано Центральной предельной теоремой). Более широкие доверительные интервалы соответствуют плохим оценкам (меньшие выборки); узкие интервалы соответствуют лучшим оценкам (большие выборки). Если нулевая гипотеза утверждает значение параметра генеральной совокупности, тест отклоняет нулевую гипотезу, когда предполагавшееся значение находится вне вычисленного доверительного интервала для параметра.