coefTest

Линейный тест гипотезы на коэффициентах модели линейной регрессии

Описание

пример

p = coefTest(mdl) вычисляет p - значение для F - тест, который весь коэффициент оценивает в mdl, за исключением термина прерывания, нуль.

пример

p = coefTest(mdl,H) выполняет F - тестируют тот H × B = 0, где B представляет вектор коэффициентов. Используйте H задавать коэффициенты, чтобы включать в F - тест.

p = coefTest(mdl,H,C) выполняет F - тестируют тот H × B = C.

пример

[p,F] = coefTest(___) также возвращается, F - тестируют статистический F использование любой из комбинаций входных аргументов в предыдущих синтаксисах.

пример

[p,F,r] = coefTest(___) также возвращает степени свободы числителя r для теста.

Примеры

свернуть все

Подбирайте модель линейной регрессии и протестируйте коэффициенты подобранной модели, чтобы видеть, являются ли они нулем.

Загрузите carsmall набор данных и составляет таблицу в который Model_Year предиктор является категориальным.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Weight,Model_Year);

Подбирайте модель линейной регрессии пробега как функция веса, вес придал квадратную форму, и модельный год.

mdl = fitlm(tbl,'MPG ~ Model_Year + Weight^2')
mdl = 
Linear regression model:
    MPG ~ 1 + Weight + Model_Year + Weight^2

Estimated Coefficients:
                      Estimate         SE         tStat       pValue  
                     __________    __________    _______    __________

    (Intercept)          54.206        4.7117     11.505    2.6648e-19
    Weight            -0.016404     0.0031249    -5.2493    1.0283e-06
    Model_Year_76        2.0887       0.71491     2.9215     0.0044137
    Model_Year_82        8.1864       0.81531     10.041    2.6364e-16
    Weight^2         1.5573e-06    4.9454e-07      3.149     0.0022303


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.78
R-squared: 0.885,  Adjusted R-Squared: 0.88
F-statistic vs. constant model: 172, p-value = 5.52e-41

Последняя линия отображения модели показывает значение F-статистической-величины модели регрессии и соответствующее p-значение. Маленькое p-значение указывает, что модель соответствует значительно лучше, чем вырожденная модель, состоящая только из термина прерывания. Можно возвратить эти два значения при помощи coefTest.

[p,F] = coefTest(mdl)
p = 5.5208e-41
F = 171.8844

Подбирайте модель линейной регрессии и протестируйте значение заданного коэффициента в подобранной модели при помощи coefTest. Можно также использовать anova протестировать значение каждого предиктора в модели.

Загрузите carsmall набор данных и составляет таблицу в который Model_Year предиктор является категориальным.

load carsmall
Model_Year = categorical(Model_Year);
tbl = table(MPG,Acceleration,Weight,Model_Year);

Подбирайте модель линейной регрессии пробега как функция веса, вес придал квадратную форму, и модельный год.

mdl = fitlm(tbl,'MPG ~ Acceleration + Model_Year + Weight')
mdl = 
Linear regression model:
    MPG ~ 1 + Acceleration + Weight + Model_Year

Estimated Coefficients:
                      Estimate         SE         tStat        pValue  
                     __________    __________    ________    __________

    (Intercept)          40.523        2.5293      16.021    5.8302e-28
    Acceleration      -0.023438       0.11353    -0.20644       0.83692
    Weight           -0.0066799    0.00045796     -14.586    2.5314e-25
    Model_Year_76        1.9898       0.80696      2.4657      0.015591
    Model_Year_82        7.9661       0.89745      8.8763    6.7725e-14


Number of observations: 94, Error degrees of freedom: 89
Root Mean Squared Error: 2.93
R-squared: 0.873,  Adjusted R-Squared: 0.867
F-statistic vs. constant model: 153, p-value = 5.86e-39

Отображение модели включает p-значение для t-статистической-величины для каждого коэффициента, чтобы протестировать нулевую гипотезу, что соответствующий коэффициент является нулем.

Можно исследовать значение коэффициента с помощью coefTest. Например, протестируйте значение Acceleration коэффициент. Согласно отображению модели, Acceleration второй предиктор. Задайте коэффициент при помощи числового вектора индекса.

[p_Acceleration,F_Acceleration,r_Acceleration] = coefTest(mdl,[0 1 0 0 0])
p_Acceleration = 0.8369
F_Acceleration = 0.0426
r_Acceleration = 1

p_Acceleration p-значение, соответствующее значению F-статистической-величины F_Acceleration, и r_Acceleration степени свободы числителя для F-теста. Возвращенное p-значение указывает на тот Acceleration не является статистически значительным в подобранной модели. Обратите внимание на то, что p_Acceleration равно p-значению t-статистической-величины (tStat) в отображении модели и F_Acceleration квадрат tStat.

Протестируйте значение категориального предиктора Model_Year. Вместо того, чтобы тестировать Model_Year_76 и Model_Year_82 отдельно, можно выполнить один тест для категориального предиктора Model_Year. Задайте Model_Year_76 и Model_Year_82 при помощи числовой матрицы индекса.

[p_Model_Year,F_Model_Year,r_Model_Year] = coefTest(mdl,[0 0 0 1 0; 0 0 0 0 1])
p_Model_Year = 2.7408e-14
F_Model_Year = 45.2691
r_Model_Year = 2

Возвращенное p-значение указывает на тот Model_Year является статистически значительным в подобранной модели.

Можно также возвратить эти значения при помощи anova.

anova(mdl)
ans=4×5 table
                     SumSq     DF    MeanSq        F          pValue  
                    _______    __    _______    ________    __________

    Acceleration    0.36613     1    0.36613    0.042618       0.83692
    Weight           1827.7     1     1827.7      212.75    2.5314e-25
    Model_Year       777.81     2      388.9      45.269    2.7408e-14
    Error            764.59    89      8.591                          

Входные параметры

свернуть все

Объект модели линейной регрессии в виде LinearModel объект, созданный при помощи fitlm или stepwiselm, или CompactLinearModel объект создается при помощи compact.

Матрица гипотезы в виде r- s числовая матрица индекса, где r количество коэффициентов, чтобы включать в F - тест и s общее количество коэффициентов.

  • Если вы задаете H, затем выход p p - значение для F - тестирует тот H × B = 0, где B представляет вектор коэффициентов.

  • Если вы задаете H и C, затем выход p p - значение для F - тестирует тот H × B = C.

Пример: [1 0 0 0 0] тестирует первый коэффициент среди пяти коэффициентов.

Типы данных: single | double

Предполагавшееся значение для тестирования нулевой гипотезы в виде числового вектора с одинаковым числом строк как H.

Если вы задаете H и C, затем выход p p - значение для F - тестирует тот H × B = C, где B представляет вектор коэффициентов.

Типы данных: single | double

Выходные аргументы

свернуть все

p - значение для F - тест, возвращенный как числовое значение в области значений [0,1].

Значение тестовой статистической величины для F - тест, возвращенный как числовое значение.

Степени свободы числителя для F - тест, возвращенный как положительное целое число. F - статистическая величина имеет r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

p - значение, F - статистическая величина и степени свободы числителя допустимы под этими предположениями:

  • Данные прибывают из модели, представленной формулой в Formula свойство подобранной модели.

  • Наблюдения независимы, условны на значениях предиктора.

Под этими предположениями позвольте β представлять (неизвестный) вектор коэффициентов линейной регрессии. Предположим, что H является матрицей полного ранга размера r-by-s, где r является количеством коэффициентов, чтобы включать в F - тест, и s является общим количеством коэффициентов. Позвольте c быть вектор-столбцом со строками r. Следующее является тестовой статистической величиной для гипотезы что  = c:

F=(Hβ^c)(HVH)1(Hβ^c).

Здесь β^ оценка вектора коэффициентов β, сохраненный в Coefficients свойство и V являются предполагаемой ковариацией содействующих оценок, сохраненных в CoefficientCovariance свойство. Когда гипотеза верна, тестовая статистическая величина, F имеет Распределение F с r и степенями свободы u, где u является степенями свободы для ошибки, сохраненной в DFE свойство.

Альтернативная функциональность

  • Значения обычно используемой тестовой статистики доступны в Coefficients свойство подобранной модели.

  • anova обеспечивает тесты для каждого предиктора модели и групп предикторов.

Расширенные возможности

Представленный в R2012a