Проверка гипотез

Проверка гипотез является распространенным методом получения выводов о населении на основе статистических данных из выборки.

В качестве примера предположим, кто-то говорит, что в определенное время в состоянии Массачусетс средняя цена галлона обычного неэтилированного газа составляла $1,15. Как вы могли определить истинность оператора? Можно было попробовать найти цены на каждой заправке в состоянии в то время. Этот подход будет окончательным, но он может быть длительным, дорогостоящим или даже невозможным.

Более простым подходом было бы найти цены на небольшом количестве случайным образом выбранных АЗС по всему состоянию, а затем вычислить среднюю выборку.

Средние значения выборки отличаются друг от друга из-за случайной изменчивости в процессе выбора. Предположим, что ваша средняя выборка составляет $1,18. Является ли различие в 0,03 доллара программным продуктом случайной выборки или значительным доказательством того, что средняя цена галлона газа на самом деле была больше 1,15 доллара? Проверка гипотез является статистическим методом для принятия таких решений.

Этот пример показывает, как использовать проверку гипотез для анализа цен на газ, измеренных в состоянии Массачусетс в течение двух отдельных месяцев.

Этот пример использует данные цены на газ в файле gas.mat. Файл содержит две случайные выборки цен на галлон газа вокруг состояния Массачусетс в 1993 году. Первая выборка, price1, содержит 20 случайных наблюдений вокруг состояния в один день в январе. Вторая выборка, price2, содержит 20 случайных наблюдений вокруг состояния через месяц.

load gas
prices = [price1 price2];

В качестве первого шага можно хотеть проверить предположение, что выборки происходят из нормальных распределений. График нормальной вероятности дает быстрое представление.

normplot(prices)

Figure contains an axes. The axes with title Normal Probability Plot contains 6 objects of type line.

Оба рассеяния примерно следуют прямыми линиями через первый и третий квартили выборок, что указывает на приблизительные нормальные распределения. Февральская выборка (правая линия) показывает незначительное отклонение от нормальности в нижнем хвосте. Сдвиг среднего значения с января по февраль налицо. Критерий гипотезы используется для количественной оценки критерия нормальности. Поскольку каждая выборка относительно небольшой, рекомендуется тест Lilliefors.

lillietest(price1)
ans = 0
lillietest(price2)
ans = 0

Уровень значимости по умолчанию lillietest составляет 5%. Логический 0, возвращенный каждым тестом, указывает на отказ отклонить нулевую гипотезу о том, что выборки обычно распределены. Этот отказ может отражать нормальность в населении или может отражать отсутствие убедительных доказательств против нулевой гипотезы из-за небольшого размера выборки.

Теперь вычислите значение выборки.

sample_means = mean(prices)
sample_means = 1×2

  115.1500  118.5000

Вы, возможно, захотите проверить нулевую гипотезу о том, что средняя цена по состоянию в день январской выборки составляла 1,15 доллара. Если вы знаете, что стандартное отклонение цен по всему состоянию исторически и последовательно составляло 0,04 доллара, то подходит z-тест.

[h,pvalue,ci] = ztest(price1/100,1.15,0.04)
h = 0
pvalue = 0.8668
ci = 2×1

    1.1340
    1.1690

Логический выход h = 0 указывает на отказ отклонить нулевую гипотезу при уровне значимости по умолчанию 5%. Это является следствием высокой вероятности при нулевой гипотезе, обозначенной значением p, наблюдения значения как крайнего или более крайнего z-статистического значения, вычисленного из выборки. 95% доверительный интервал по среднему значению [1.1340 1.1690] включает предполагаемое среднее популяционное значение 1,15 долл. США.

Является ли более поздняя выборка более сильным доказательством отказа от нулевой гипотезы о средней цене в масштабе штата в 1,15 доллара в феврале? Сдвиг, показанный на графике вероятностей, и различие в вычисленных средствах выборки предполагают это. Сдвиг может свидетельствовать о значительных колебаниях на рынке, вызывая вопросы относительно валидности использования исторического стандартного отклонения. Если известное стандартное отклонение не может быть принято, более подходящим является t-тест.

[h,pvalue,ci] = ttest(price2/100,1.15)
h = 1
pvalue = 4.9517e-04
ci = 2×1

    1.1675
    1.2025

Логический выход h = 1 указывает на отказ от нулевой гипотезы при уровне значимости по умолчанию 5%. В этом случае 95% доверительный интервал по среднему значению не включает предполагаемое среднее население в 1,15 долл. США.

Вы, возможно, захотите изучить сдвиг цен немного более внимательно. Функция ttest2 тесты, если две независимые выборки происходят из нормальных распределений с равными, но неизвестными стандартными отклонениями и тем же средним значением, против альтернативы, что средства неравны.

[h,sig,ci] = ttest2(price1,price2)
h = 1
sig = 0.0083
ci = 2×1

   -5.7845
   -0.9155

Нулевая гипотеза отклоняется на уровне значимости по умолчанию 5%, и доверительный интервал на различии средств не включает гипотезированное значение 0. График с надрезом - еще один способ визуализации сдвига.

boxplot(prices,1)
h = gca;
h.XTick = [1 2];
h.XTickLabel = {'January','February'};
xlabel('Month')
ylabel('Prices ($0.01)')

Figure contains an axes. The axes contains 14 objects of type line.

График отображает распределение выборок вокруг их медиан. Высоты вырезов в каждом кубе вычисляются так, что соседние рамки имеют непереключающиеся вырезы, когда их медианы различаются на уровне значимости по умолчанию 5%. Расчет основан на допущении нормальности в данных, но сравнение является достаточно устойчивым для других распределений. Параллельные графики обеспечивают своего рода тест визуальной гипотезы, сравнивая медианы, а не средства. График выше, по-видимому, едва отвергает нулевую гипотезу о равных медианах.

Непараметрический критерий ранжированной суммы Уилкоксона, реализованный функцией ranksum, может использоваться, чтобы количественно оценить тест равной медианы. Он проверяет, происходят ли две независимые выборки из одинаковых непрерывных (не обязательно нормальных) распределений с равными медианами против альтернативы, что они не имеют одинаковых медиан.

[p,h] = ranksum(price1,price2)
p = 0.0095
h = logical
   1

Тест отклоняет нулевую гипотезу равных медиан на уровне значимости по умолчанию 5%.

См. также

| | | | |

Похожие темы