exponenta event banner

coefTest

Тест линейной гипотезы по коэффициентам модели линейной регрессии

Описание

пример

p = coefTest(mdl) вычисляет значение p для F-теста, которое все коэффициенты оценивают в mdl, за исключением члена перехвата, равны нулю.

пример

p = coefTest(mdl,H) выполняет F-тест, в котором H × B = 0, где B представляет вектор коэффициентов. Использовать H для указания коэффициентов, включаемых в F-тест.

p = coefTest(mdl,H,C) выполняет F-тест, в котором H × B = C.

пример

[p,F] = coefTest(___) также возвращает статистику F-теста F используя любую из комбинаций входных аргументов в предыдущих синтаксисах.

пример

[p,F,r] = coefTest(___) также возвращает числительные степени свободы r для теста.

Примеры

свернуть все

Установите линейную регрессионную модель и проверьте коэффициенты подогнанной модели, чтобы убедиться, что они равны нулю.

Загрузить carsmall набор данных и создание таблицы, в которой Model_Year предиктор категоричен.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Weight,Model_Year);

Подгонка модели линейной регрессии пробега в зависимости от веса, квадрата веса и модельного года.

mdl = fitlm(tbl,'MPG ~ Model_Year + Weight^2')
mdl = 
Linear regression model:
    MPG ~ 1 + Weight + Model_Year + Weight^2

Estimated Coefficients:
                      Estimate         SE         tStat       pValue  
                     __________    __________    _______    __________

    (Intercept)          54.206        4.7117     11.505    2.6648e-19
    Weight            -0.016404     0.0031249    -5.2493    1.0283e-06
    Model_Year_76        2.0887       0.71491     2.9215     0.0044137
    Model_Year_82        8.1864       0.81531     10.041    2.6364e-16
    Weight^2         1.5573e-06    4.9454e-07      3.149     0.0022303


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.78
R-squared: 0.885,  Adjusted R-Squared: 0.88
F-statistic vs. constant model: 172, p-value = 5.52e-41

Последняя строка отображения модели показывает F-статистическое значение регрессионной модели и соответствующее p-значение. Небольшое значение p указывает, что модель подходит значительно лучше, чем вырожденная модель, состоящая только из члена перехвата. Эти два значения можно вернуть с помощью coefTest.

[p,F] = coefTest(mdl)
p = 5.5208e-41
F = 171.8844

Подгонка модели линейной регрессии и проверка значимости указанного коэффициента в подогнанной модели с помощью coefTest. Также можно использовать anova чтобы проверить значимость каждого предиктора в модели.

Загрузить carsmall набор данных и создание таблицы, в которой Model_Year предиктор категоричен.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Acceleration,Weight,Model_Year);

Подгонка модели линейной регрессии пробега в зависимости от веса, квадрата веса и модельного года.

mdl = fitlm(tbl,'MPG ~ Acceleration + Model_Year + Weight')
mdl = 
Linear regression model:
    MPG ~ 1 + Acceleration + Weight + Model_Year

Estimated Coefficients:
                      Estimate         SE         tStat        pValue  
                     __________    __________    ________    __________

    (Intercept)          40.523        2.5293      16.021    5.8302e-28
    Acceleration      -0.023438       0.11353    -0.20644       0.83692
    Weight           -0.0066799    0.00045796     -14.586    2.5314e-25
    Model_Year_76        1.9898       0.80696      2.4657      0.015591
    Model_Year_82        7.9661       0.89745      8.8763    6.7725e-14


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.93
R-squared: 0.873,  Adjusted R-Squared: 0.867
F-statistic vs. constant model: 153, p-value = 5.86e-39

Отображение модели включает в себя значение p для t-статистики для каждого коэффициента, чтобы проверить нулевую гипотезу, что соответствующий коэффициент равен нулю.

Проверить значимость коэффициента можно с помощью coefTest. Например, проверьте значимость Acceleration коэффициент. В соответствии с отображением модели Acceleration является вторым предиктором. Укажите коэффициент с помощью числового вектора индекса.

[p_Acceleration,F_Acceleration,r_Acceleration] = coefTest(mdl,[0 1 0 0 0])
p_Acceleration = 0.8369
F_Acceleration = 0.0426
r_Acceleration = 1

p_Acceleration - p-значение, соответствующее F-статистическому значению F_Acceleration, и r_Acceleration - числительные степени свободы для F-теста. Возвращенное значение p указывает, что Acceleration не является статистически значимым в подогнанной модели. Обратите внимание, что p_Acceleration равно p-значению t-статистики (tStat) на экране модели, и F_Acceleration является квадратом tStat.

Проверить значимость категориального предиктора Model_Year. Вместо тестирования Model_Year_76 и Model_Year_82 отдельно можно выполнить один тест для категориального предиктора Model_Year. Определить Model_Year_76 и Model_Year_82 с использованием матрицы числового индекса.

[p_Model_Year,F_Model_Year,r_Model_Year] = coefTest(mdl,[0 0 0 1 0; 0 0 0 0 1])
p_Model_Year = 2.7408e-14
F_Model_Year = 45.2691
r_Model_Year = 2

Возвращенное значение p указывает, что Model_Year статистически значим в подогнанной модели.

Эти значения также можно вернуть с помощью anova.

anova(mdl)
ans=4×5 table
                     SumSq     DF    MeanSq        F          pValue  
                    _______    __    _______    ________    __________

    Acceleration    0.36613     1    0.36613    0.042618       0.83692
    Weight           1827.7     1     1827.7      212.75    2.5314e-25
    Model_Year       777.81     2      388.9      45.269    2.7408e-14
    Error            764.59    89      8.591                          

Входные аргументы

свернуть все

Объект модели линейной регрессии, указанный как LinearModel объект, созданный с помощью fitlm или stepwiselm, или CompactLinearModel объект, созданный с помощью compact.

Матрица гипотез, указанная как rоколо-s матрица числового индекса, где r - количество коэффициентов, включаемых в F-тест, и s - общее число коэффициентов.

  • При указании H, то выход p - p-значение для F-теста, которое H × B = 0, где B представляет вектор коэффициентов.

  • При указании H и C, то выход p - p-значение для F-теста, что H × B = C.

Пример: [1 0 0 0 0] проверяет первый коэффициент среди пяти коэффициентов.

Типы данных: single | double

Гипотетическое значение для проверки нулевой гипотезы, указанное как числовой вектор с тем же количеством строк, что и H.

При указании H и C, то выход p - p-значение для F-теста, которое H × B = C, где B представляет вектор коэффициентов.

Типы данных: single | double

Выходные аргументы

свернуть все

p-значение для F-теста, возвращаемое как числовое значение в диапазоне [0,1].

Значение статистики теста для F-теста, возвращаемое как числовое значение.

Числительные степени свободы для F-теста, возвращаемые как положительное целое число. F-статистика имеет r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

Степени свободы p-значения, F-статистики и числителя действительны при следующих допущениях:

  • Данные получены из модели, представленной формулой в Formula свойство подгоняемой модели.

  • Наблюдения независимы, зависят от предикторных значений.

В этих предположениях пусть β представляет (неизвестный) вектор коэффициентов линейной регрессии. Предположим, что H является матрицей полного ранга размера r-by-s, где r - количество коэффициентов, включаемых в F-тест, а s - общее число коэффициентов. Пусть c - вектор столбца с r строками. Ниже приведена проверочная статистика для гипотезы, что  = c:

F = (^ c) (HVH ) 1 (Hβ ^ − c).

Здесь β ^ - оценка вектора коэффициентов β, хранящаяся в Coefficients свойство, а V - оценочная ковариация оценок коэффициентов, сохраненных в CoefficientCovariance собственность. Когда гипотеза верна, проверочная статистика F имеет F-распределение с r и u степенями свободы, где u - степени свободы для ошибки, хранящиеся в DFE собственность.

Альтернативная функциональность

  • Значения обычно используемой статистики тестирования доступны в Coefficients свойство подгоняемой модели.

  • anova предоставляет тесты для каждого предиктора модели и групп предикторов.

Расширенные возможности

Представлен в R2012a