coefTest

Линейный тест гипотезы на коэффициентах модели линейной регрессии

Синтаксис

p = coefTest(mdl)
p = coefTest(mdl,H)
p = coefTest(mdl,H,C)
[p,F] = coefTest(___)
[p,F,r] = coefTest(___)

Описание

пример

p = coefTest(mdl) вычисляет p - значение для F - тест, что весь коэффициент оценки в mdl, за исключением термина прерывания, является нулем.

пример

p = coefTest(mdl,H) выполняет F - тестируют тот H × B = 0, где B представляет вектор коэффициентов. Используйте H, чтобы задать коэффициенты, чтобы включать в F - тест.

p = coefTest(mdl,H,C) выполняет F - тестируют тот H × B = C.

пример

[p,F] = coefTest(___) также возвращается, F - тестируют статистический F с помощью любой из комбинаций входных аргументов в предыдущих синтаксисах.

пример

[p,F,r] = coefTest(___) также возвращает степени свободы числителя r для теста.

Примеры

свернуть все

Соответствуйте модели линейной регрессии и протестируйте коэффициенты подобранной модели, чтобы видеть, являются ли они нулем.

Загрузите набор данных carsmall и составьте таблицу, в которой предиктор Model_Year является категориальным.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Weight,Model_Year);

Соответствуйте модели линейной регрессии пробега как функция веса, вес придал квадратную форму, и модельный год.

mdl = fitlm(tbl,'MPG ~ Model_Year + Weight^2')
mdl = 
Linear regression model:
    MPG ~ 1 + Weight + Model_Year + Weight^2

Estimated Coefficients:
                      Estimate         SE         tStat       pValue  
                     __________    __________    _______    __________

    (Intercept)          54.206        4.7117     11.505    2.6648e-19
    Weight            -0.016404     0.0031249    -5.2493    1.0283e-06
    Model_Year_76        2.0887       0.71491     2.9215     0.0044137
    Model_Year_82        8.1864       0.81531     10.041    2.6364e-16
    Weight^2         1.5573e-06    4.9454e-07      3.149     0.0022303


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.78
R-squared: 0.885,  Adjusted R-Squared: 0.88
F-statistic vs. constant model: 172, p-value = 5.52e-41

Последняя строка образцового отображения показывает значение F-статистической-величины модели регрессии и соответствующее p-значение. Маленькое p-значение указывает, что модель соответствует значительно лучше, чем вырожденная модель, состоящая только из термина прерывания. Можно возвратить эти два значения при помощи coefTest.

[p F] = coefTest(mdl)
p = 5.5208e-41
F = 171.8844

Соответствуйте модели линейной регрессии и протестируйте значение заданного коэффициента в подобранной модели при помощи coefTest. Можно также использовать anova, чтобы протестировать значение каждого предиктора в модели.

Загрузите набор данных carsmall и составьте таблицу, в которой предиктор Model_Year является категориальным.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Acceleration,Weight,Model_Year);

Соответствуйте модели линейной регрессии пробега как функция веса, вес придал квадратную форму, и модельный год.

mdl = fitlm(tbl,'MPG ~ Acceleration + Model_Year + Weight')
mdl = 
Linear regression model:
    MPG ~ 1 + Acceleration + Weight + Model_Year

Estimated Coefficients:
                      Estimate         SE         tStat        pValue  
                     __________    __________    ________    __________

    (Intercept)          40.523        2.5293      16.021    5.8302e-28
    Acceleration      -0.023438       0.11353    -0.20644       0.83692
    Weight           -0.0066799    0.00045796     -14.586    2.5314e-25
    Model_Year_76        1.9898       0.80696      2.4657      0.015591
    Model_Year_82        7.9661       0.89745      8.8763    6.7725e-14


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.93
R-squared: 0.873,  Adjusted R-Squared: 0.867
F-statistic vs. constant model: 153, p-value = 5.86e-39

Образцовое отображение включает p-значение для t-статистической-величины для каждого коэффициента, чтобы протестировать нулевую гипотезу, что соответствующий коэффициент является нулем.

Можно исследовать значение коэффициента с помощью coefTest. Например, протестируйте значение коэффициента Acceleration. Согласно образцовому отображению, Acceleration является вторым предиктором. Задайте коэффициент при помощи числового индексного вектора.

[p_Acceleration,F_Acceleration,r_Acceleration] = coefTest(mdl,[0 1 0 0 0])
p_Acceleration = 0.8369
F_Acceleration = 0.0426
r_Acceleration = 1

p_Acceleration является p-значением, соответствующим значению F-статистической-величины F_Acceleration, и r_Acceleration является степенями свободы числителя для F-теста. Возвращенное p-значение указывает, что Acceleration не является статистически значительным в подобранной модели. Обратите внимание на то, что p_Acceleration равен p-значению t-статистической-величины (tStat) в образцовом отображении, и F_Acceleration является квадратом tStat.

Протестируйте значение категориального предиктора Model_Year. Вместо того, чтобы тестировать Model_Year_76 и Model_Year_82 отдельно, можно выполнить один тест для категориального предиктора Model_Year. Задайте Model_Year_76 и Model_Year_82 при помощи числовой индексной матрицы.

[p_Model_Year,F_Model_Year,r_Model_Year] = coefTest(mdl,[0 0 0 1 0; 0 0 0 0 1])
p_Model_Year = 2.7408e-14
F_Model_Year = 45.2691
r_Model_Year = 2

Возвращенное p-значение указывает, что Model_Year является статистически значительным в подобранной модели.

Можно также возвратить эти значения при помощи anova.

anova(mdl)
ans=4×5 table
                     SumSq     DF    MeanSq        F          pValue  
                    _______    __    _______    ________    __________

    Acceleration    0.36613     1    0.36613    0.042618       0.83692
    Weight           1827.7     1     1827.7      212.75    2.5314e-25
    Model_Year       777.81     2      388.9      45.269    2.7408e-14
    Error            764.59    89      8.591                          

Входные параметры

свернуть все

Объект модели линейной регрессии, заданный как объект LinearModel, созданный при помощи fitlm или stepwiselm или объекта CompactLinearModel, создается при помощи compact.

Матрица гипотезы, заданная как r-by-s числовая индексная матрица, где r является количеством коэффициентов, чтобы включать в F - тест и s, является общим количеством коэффициентов.

  • Если вы задаете H, то выводом p является p - значение для F - тестирует тот H × B = 0, где B представляет вектор коэффициентов.

  • Если вы задаете H и C, то выводом p является p - значение для F - тестирует тот H × B = C.

Пример: [1 0 0 0 0] тестирует первый коэффициент среди пяти коэффициентов

Типы данных: single | double

Предполагавшееся значение для тестирования нулевой гипотезы, заданной как числовой вектор с одинаковым числом строк как H.

Если вы задаете H и C, то выводом p является p - значение для F - тестирует тот H × B = C, где B представляет вектор коэффициентов.

Типы данных: single | double

Выходные аргументы

свернуть все

p - значение для F - тест, возвращенный как числовое значение в области значений [0,1].

Значение тестовой статистической величины для F - тест, возвращенный как числовое значение.

Степени свободы числителя для F - тест, возвращенный как положительное целое число. F - статистическая величина имеет степени свободы r в числителе и степени свободы mdl.DFE в знаменателе.

Алгоритмы

p - значение, F - статистическая величина и степени свободы числителя допустимы под этими предположениями:

  • Данные прибывают из модели, представленной формулой в свойстве Formula подобранной модели.

  • Наблюдения независимы, условны на значениях предиктора.

Под этими предположениями содержат, позволяют β представлять (неизвестный) вектор коэффициентов линейной регрессии. Предположим, что H является матрицей полного ранга размера r-by-s, где r является количеством коэффициентов, чтобы включать в F - тест, и s является общим количеством коэффициентов. Позвольте c быть вектором тот же размер как β. Следующее является тестовой статистической величиной для гипотезы что  = c:

F=(Hβ^v)(HCH)1(Hβ^v).

Здесь β^ оценка вектора коэффициентов β, сохраненный в свойстве Coefficients, и V является предполагаемой ковариацией содействующих оценок, сохраненных в свойстве CoefficientCovariance. Когда гипотеза верна, тестовая статистическая величина, F имеет Распределение F с r и степенями свободы u, где u является степенями свободы для ошибки, сохраненной в свойстве DFE.

Альтернативная функциональность

  • Значения обычно используемой тестовой статистики доступны в свойстве Coefficients подобранной модели.

  • anova обеспечивает тесты для каждого образцового предиктора и групп предикторов.

Представленный в R2012a