coefTest

Линейный тест гипотезы на коэффициентах модели линейной регрессии

Описание

пример

p = coefTest(mdl) вычисляет p - значение для F - тест, который весь коэффициент оценивает в mdl, за исключением термина прерывания, нуль.

пример

p = coefTest(mdl,H) выполняет F - тестируют тот H × B = 0, где B представляет вектор коэффициентов. Используйте H задавать коэффициенты, чтобы включать в F - тест.

p = coefTest(mdl,H,C) выполняет F - тестируют тот H × B = C.

пример

[p,F] = coefTest(___) также возвращается, F - тестируют статистический F использование любой из комбинаций входных аргументов в предыдущих синтаксисах.

пример

[p,F,r] = coefTest(___) также возвращает степени свободы числителя r для теста.

Примеры

свернуть все

Подбирайте модель линейной регрессии и протестируйте коэффициенты подобранной модели, чтобы видеть, являются ли они нулем.

Загрузите carsmall набор данных и составляет таблицу в который Model_Year предиктор является категориальным.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Weight,Model_Year);

Подбирайте модель линейной регрессии пробега как функция веса, вес придал квадратную форму, и модельный год.

mdl = fitlm(tbl,'MPG ~ Model_Year + Weight^2')
mdl = 
Linear regression model:
    MPG ~ 1 + Weight + Model_Year + Weight^2

Estimated Coefficients:
                      Estimate         SE         tStat       pValue  
                     __________    __________    _______    __________

    (Intercept)          54.206        4.7117     11.505    2.6648e-19
    Weight            -0.016404     0.0031249    -5.2493    1.0283e-06
    Model_Year_76        2.0887       0.71491     2.9215     0.0044137
    Model_Year_82        8.1864       0.81531     10.041    2.6364e-16
    Weight^2         1.5573e-06    4.9454e-07      3.149     0.0022303


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.78
R-squared: 0.885,  Adjusted R-Squared: 0.88
F-statistic vs. constant model: 172, p-value = 5.52e-41

Последняя линия отображения модели показывает значение F-статистической-величины модели регрессии и соответствующее p-значение. Маленькое p-значение указывает, что модель соответствует значительно лучше, чем вырожденная модель, состоящая только из термина прерывания. Можно возвратить эти два значения при помощи coefTest.

[p,F] = coefTest(mdl)
p = 5.5208e-41
F = 171.8844

Подбирайте модель линейной регрессии и протестируйте значение заданного коэффициента в подобранной модели при помощи coefTest. Можно также использовать anova протестировать значение каждого предиктора в модели.

Загрузите carsmall набор данных и составляет таблицу в который Model_Year предиктор является категориальным.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Acceleration,Weight,Model_Year);

Подбирайте модель линейной регрессии пробега как функция веса, вес придал квадратную форму, и модельный год.

mdl = fitlm(tbl,'MPG ~ Acceleration + Model_Year + Weight')
mdl = 
Linear regression model:
    MPG ~ 1 + Acceleration + Weight + Model_Year

Estimated Coefficients:
                      Estimate         SE         tStat        pValue  
                     __________    __________    ________    __________

    (Intercept)          40.523        2.5293      16.021    5.8302e-28
    Acceleration      -0.023438       0.11353    -0.20644       0.83692
    Weight           -0.0066799    0.00045796     -14.586    2.5314e-25
    Model_Year_76        1.9898       0.80696      2.4657      0.015591
    Model_Year_82        7.9661       0.89745      8.8763    6.7725e-14


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.93
R-squared: 0.873,  Adjusted R-Squared: 0.867
F-statistic vs. constant model: 153, p-value = 5.86e-39

Отображение модели включает p-значение для t-статистической-величины для каждого коэффициента, чтобы протестировать нулевую гипотезу, что соответствующий коэффициент является нулем.

Можно исследовать значение коэффициента с помощью coefTest. Например, протестируйте значение Acceleration коэффициент. Согласно отображению модели, Acceleration второй предиктор. Задайте коэффициент при помощи числового вектора индекса.

[p_Acceleration,F_Acceleration,r_Acceleration] = coefTest(mdl,[0 1 0 0 0])
p_Acceleration = 0.8369
F_Acceleration = 0.0426
r_Acceleration = 1

p_Acceleration p-значение, соответствующее значению F-статистической-величины F_Acceleration, и r_Acceleration степени свободы числителя для F-теста. Возвращенное p-значение указывает на тот Acceleration не является статистически значительным в подобранной модели. Обратите внимание на то, что p_Acceleration равно p-значению t-статистической-величины (tStat) в отображении модели и F_Acceleration квадрат tStat.

Протестируйте значение категориального предиктора Model_Year. Вместо того, чтобы тестировать Model_Year_76 и Model_Year_82 отдельно, можно выполнить один тест для категориального предиктора Model_Year. Задайте Model_Year_76 и Model_Year_82 при помощи числовой матрицы индекса.

[p_Model_Year,F_Model_Year,r_Model_Year] = coefTest(mdl,[0 0 0 1 0; 0 0 0 0 1])
p_Model_Year = 2.7408e-14
F_Model_Year = 45.2691
r_Model_Year = 2

Возвращенное p-значение указывает на тот Model_Year является статистически значительным в подобранной модели.

Можно также возвратить эти значения при помощи anova.

anova(mdl)
ans=4×5 table
                     SumSq     DF    MeanSq        F          pValue  
                    _______    __    _______    ________    __________

    Acceleration    0.36613     1    0.36613    0.042618       0.83692
    Weight           1827.7     1     1827.7      212.75    2.5314e-25
    Model_Year       777.81     2      388.9      45.269    2.7408e-14
    Error            764.59    89      8.591                          

Входные параметры

свернуть все

Объект модели линейной регрессии, заданный как LinearModel объект создается при помощи fitlm или stepwiselm, или CompactLinearModel объект создается при помощи compact.

Матрица гипотезы, заданная как r- s числовая матрица индекса, где r количество коэффициентов, чтобы включать в F - тест и s общее количество коэффициентов.

  • Если вы задаете H, затем выход p p - значение для F - тестирует тот H × B = 0, где B представляет вектор коэффициентов.

  • Если вы задаете H и C, затем выход p p - значение для F - тестирует тот H × B = C.

Пример: [1 0 0 0 0] тестирует первый коэффициент среди пяти коэффициентов

Типы данных: single | double

Предполагавшееся значение для тестирования нулевой гипотезы, заданной как числовой вектор с одинаковым числом строк как H.

Если вы задаете H и C, затем выход p p - значение для F - тестирует тот H × B = C, где B представляет вектор коэффициентов.

Типы данных: single | double

Выходные аргументы

свернуть все

p - значение для F - тест, возвращенный как числовое значение в области значений [0,1].

Значение тестовой статистической величины для F - тест, возвращенный как числовое значение.

Степени свободы числителя для F - тест, возвращенный как положительное целое число. F - статистическая величина имеет r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

p - значение, F - статистическая величина и степени свободы числителя допустимы под этими предположениями:

  • Данные прибывают из модели, представленной формулой в Formula свойство подобранной модели.

  • Наблюдения независимы, условны на значениях предиктора.

Под этими предположениями содержат, позволяют β представлять (неизвестный) вектор коэффициентов линейной регрессии. Предположим, что H является матрицей полного ранга размера r-by-s, где r количество коэффициентов, чтобы включать в F - тест и s общее количество коэффициентов. Позвольте c быть вектором тот же размер как β. Следующее является тестовой статистической величиной для гипотезы что  = c:

F=(Hβ^c)(HVH)1(Hβ^c).

Здесь β^ оценка вектора коэффициентов β, сохраненный в Coefficients свойство и V являются предполагаемой ковариацией содействующих оценок, сохраненных в CoefficientCovariance свойство. Когда гипотеза верна, тестовая статистическая величина, F имеет Распределение F с r и степенями свободы u, где u является степенями свободы для ошибки, сохраненной в DFE свойство.

Альтернативная функциональность

  • Значения обычно используемой тестовой статистики доступны в Coefficients свойство подобранной модели.

  • anova обеспечивает тесты для каждого предиктора модели и групп предикторов.

Представленный в R2012a