coefTest

Линейный тест гипотезы на коэффициентах линейной регрессионой модели

Описание

пример

p = coefTest(mdl) вычисляет p -value для F -test, который все коэффициенты оценивают в mdl, кроме срока точки пересечения, равны нулю.

пример

p = coefTest(mdl,H) выполняет F -test, который H × B = 0, где B представляет вектор коэффициента. Использование H задать коэффициенты для включения в F -test.

p = coefTest(mdl,H,C) выполняет F -test, который H × B = C .

пример

[p,F] = coefTest(___) также возвращает F -test statistic F использование любой комбинации входных аргументов в предыдущих синтаксисах.

пример

[p,F,r] = coefTest(___) также возвращает числитель степеней свободы r для теста.

Примеры

свернуть все

Подбирайте линейную регрессионую модель и проверяйте коэффициенты подобранной модели, чтобы увидеть, являются ли они нулем.

Загрузите carsmall Данные установите и создайте таблицу, в которой Model_Year предиктор категориален.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Weight,Model_Year);

Подгонка линейной регрессионной модели пробега в зависимости от веса, квадрата веса и модельного года.

mdl = fitlm(tbl,'MPG ~ Model_Year + Weight^2')
mdl = 
Linear regression model:
    MPG ~ 1 + Weight + Model_Year + Weight^2

Estimated Coefficients:
                      Estimate         SE         tStat       pValue  
                     __________    __________    _______    __________

    (Intercept)          54.206        4.7117     11.505    2.6648e-19
    Weight            -0.016404     0.0031249    -5.2493    1.0283e-06
    Model_Year_76        2.0887       0.71491     2.9215     0.0044137
    Model_Year_82        8.1864       0.81531     10.041    2.6364e-16
    Weight^2         1.5573e-06    4.9454e-07      3.149     0.0022303


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.78
R-squared: 0.885,  Adjusted R-Squared: 0.88
F-statistic vs. constant model: 172, p-value = 5.52e-41

Последняя линия отображения модели показывает F-статистическое значение регрессионой модели и соответствующее p-значение. Маленькое значение p указывает, что модель подходит значительно лучше, чем вырожденная модель, состоящая только из члена точки пересечения. Можно вернуть эти два значения при помощи coefTest.

[p,F] = coefTest(mdl)
p = 5.5208e-41
F = 171.8844

Подгонка линейной регрессионной модели и проверка значимости заданного коэффициента в подобранной модели при помощи coefTest. Можно также использовать anova чтобы проверить значимость каждого предиктора в модели.

Загрузите carsmall Данные установите и создайте таблицу, в которой Model_Year предиктор категориален.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Acceleration,Weight,Model_Year);

Подгонка линейной регрессионной модели пробега в зависимости от веса, квадрата веса и модельного года.

mdl = fitlm(tbl,'MPG ~ Acceleration + Model_Year + Weight')
mdl = 
Linear regression model:
    MPG ~ 1 + Acceleration + Weight + Model_Year

Estimated Coefficients:
                      Estimate         SE         tStat        pValue  
                     __________    __________    ________    __________

    (Intercept)          40.523        2.5293      16.021    5.8302e-28
    Acceleration      -0.023438       0.11353    -0.20644       0.83692
    Weight           -0.0066799    0.00045796     -14.586    2.5314e-25
    Model_Year_76        1.9898       0.80696      2.4657      0.015591
    Model_Year_82        7.9661       0.89745      8.8763    6.7725e-14


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.93
R-squared: 0.873,  Adjusted R-Squared: 0.867
F-statistic vs. constant model: 153, p-value = 5.86e-39

Отображение модели включает p-значение для t-статистического значения для каждого коэффициента, чтобы проверить нулевую гипотезу, что соответствующий коэффициент равен нулю.

Можно изучить значимость коэффициента, используя coefTest. Для примера проверьте значимость Acceleration коэффициент. Согласно отображения модели, Acceleration является вторым предиктором. Задайте коэффициент при помощи числового вектора индекса.

[p_Acceleration,F_Acceleration,r_Acceleration] = coefTest(mdl,[0 1 0 0 0])
p_Acceleration = 0.8369
F_Acceleration = 0.0426
r_Acceleration = 1

p_Acceleration - p-значение, соответствующее F-статистическому значению F_Acceleration, и r_Acceleration - степени свободы числителя для F-теста. Возвращенное значение p указывает, что Acceleration не является статистически значимым в подобранной модели. Обратите внимание, что p_Acceleration равно p-значению t-statistic (tStat) в отображении модели, и F_Acceleration - квадрат tStat.

Проверьте значимость категориального предиктора Model_Year. Вместо проверки Model_Year_76 и Model_Year_82 отдельно можно выполнить один тест для категориального предиктора Model_Year. Задайте Model_Year_76 и Model_Year_82 при помощи числовой матрицы индексов.

[p_Model_Year,F_Model_Year,r_Model_Year] = coefTest(mdl,[0 0 0 1 0; 0 0 0 0 1])
p_Model_Year = 2.7408e-14
F_Model_Year = 45.2691
r_Model_Year = 2

Возвращенное значение p указывает, что Model_Year является статистически значимым в подобранной модели.

Можно также вернуть эти значения при помощи anova.

anova(mdl)
ans=4×5 table
                     SumSq     DF    MeanSq        F          pValue  
                    _______    __    _______    ________    __________

    Acceleration    0.36613     1    0.36613    0.042618       0.83692
    Weight           1827.7     1     1827.7      212.75    2.5314e-25
    Model_Year       777.81     2      388.9      45.269    2.7408e-14
    Error            764.59    89      8.591                          

Входные параметры

свернуть все

Объект модели линейной регрессии, заданный как LinearModel объект, созданный при помощи fitlm или stepwiselm, или CompactLinearModel объект, созданный при помощи compact.

Матрица гипотез, заданная как r-by- s матрица числового индекса, где r - количество коэффициентов, включаемых в F -test, и s - общее количество коэффициентов.

  • Если вы задаете H, затем выход p p - оценивают за F - проверяют тот <reservedrangesplaceholder2> × <reservedrangesplaceholder1> = 0, где B представляет содействующий вектор.

  • Если вы задаете H и C, затем выход p p - оценивают за F - проверяют тот <reservedrangesplaceholder2> × <reservedrangesplaceholder1> = C.

Пример: [1 0 0 0 0] проверяет первый коэффициент среди пяти коэффициентов.

Типы данных: single | double

Гипотезированное значение для проверки гипотезы null, заданное как числовой вектор с одинаковым числом строк, как H.

Если вы задаете H и C, затем выход p p - оценивают за F - проверяют тот <reservedrangesplaceholder3> × <reservedrangesplaceholder2> = C, где B представляет содействующий вектор.

Типы данных: single | double

Выходные аргументы

свернуть все

p -value для F -test, возвращенный как числовое значение в области значений [0,1].

Значение тестовой статистики для F -test, возвращаемое в виде числового значения.

Числитель степеней свободы для F -test, возвращается как положительное целое число. У F-statistic r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

p -значение, F -statistic и степени свободы числителя действительны при этих предположениях:

  • Данные получены из модели, представленной формулой в Formula свойство подобранной модели.

  • Наблюдения являются независимыми, обусловленными значениями предиктора.

В этих предположениях позвольте β представлять (неизвестный) вектор коэффициента линейной регрессии. Предположим H что это матрица полного ранга размера r -by- s, где r - количество коэффициентов, включаемых в F -test, и s - общее количество коэффициентов. Позвольте c быть вектором-столбцом с r строками. Следующее является тестовой статистикой для гипотезы, что  Hβ = c:

F=(Hβ^c)(HVH)1(Hβ^c).

Здесь β^ - оценка вектора β, сохраненная в Coefficients свойство, и V является оценочной ковариацией оценок коэффициентов, сохраненных в CoefficientCovariance свойство. Когда гипотеза верна, тестовая статистическая F имеет F- Распределения с r и u степенями свободы, где u - степени свободы от ошибки, сохраненные в DFE свойство.

Альтернативная функциональность

  • Значения обычно используемой тестовой статистики доступны в Coefficients свойство подобранной модели.

  • anova предоставляет тесты для каждого предиктора модели и групп предикторов.

Расширенные возможности

Введенный в R2012a