exponenta event banner

coefTest

Тест линейной гипотезы по обобщенным коэффициентам модели линейной регрессии

Описание

пример

p = coefTest(mdl) вычисляет значение p для F-теста, которое все коэффициенты оценивают в mdl, за исключением члена перехвата, равны нулю.

пример

p = coefTest(mdl,H) выполняет F-тест, в котором H × B = 0, где B представляет вектор коэффициентов. Использовать H для указания коэффициентов, включаемых в F-тест.

p = coefTest(mdl,H,C) выполняет F-тест, в котором H × B = C.

[p,F] = coefTest(___) также возвращает статистику F-теста F используя любую из комбинаций входных аргументов в предыдущих синтаксисах.

[p,F,r] = coefTest(___) также возвращает числительные степени свободы r для теста.

Примеры

свернуть все

Поместите обобщенную модель линейной регрессии и проверьте коэффициенты подогнанной модели, чтобы выяснить, отличаются ли они от нуля.

Создание выборочных данных с использованием случайных чисел Пуассона с двумя основными предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную модель линейной регрессии данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Проверьте, имеет ли подогнанная модель коэффициенты, которые значительно отличаются от нуля.

p = coefTest(mdl)
p = 4.1131e-153

Небольшое значение p указывает, что модель подходит значительно лучше, чем вырожденная модель, состоящая только из члена перехвата.

Подгонка обобщенной модели линейной регрессии и проверка значимости заданного коэффициента в подгоняемой модели.

Создание выборочных данных с использованием случайных чисел Пуассона с двумя основными предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную модель линейной регрессии данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Проверка значимости x1 коэффициент. В соответствии с отображением модели x1 является вторым предиктором. Укажите коэффициент с помощью числового вектора индекса.

p = coefTest(mdl,[0 1 0])
p = 2.8681e-145

Возвращенное значение p указывает, что x1 статистически значим в подогнанной модели.

Входные аргументы

свернуть все

Обобщенная модель линейной регрессии, заданная как GeneralizedLinearModel объект, созданный с помощью fitglm или stepwiseglm, или CompactGeneralizedLinearModel объект, созданный с помощью compact.

Матрица гипотез, указанная как rоколо-s матрица числового индекса, где r - количество коэффициентов, включаемых в F-тест, и s - общее число коэффициентов.

  • При указании H, то выход p - p-значение для F-теста, которое H × B = 0, где B представляет вектор коэффициентов.

  • При указании H и C, то выход p - p-значение для F-теста, что H × B = C.

Пример: [1 0 0 0 0] проверяет первый коэффициент среди пяти коэффициентов.

Типы данных: single | double

Гипотетическое значение для проверки нулевой гипотезы, указанное как числовой вектор с тем же количеством строк, что и H.

При указании H и C, то выход p - p-значение для F-теста, которое H × B = C, где B представляет вектор коэффициентов.

Типы данных: single | double

Выходные аргументы

свернуть все

p-значение для F-теста, возвращаемое как числовое значение в диапазоне [0,1].

Значение статистики теста для F-теста, возвращаемое как числовое значение.

Числительные степени свободы для F-теста, возвращаемые как положительное целое число. F-статистика имеет r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

Степени свободы p-значения, F-статистики и числителя действительны при следующих допущениях:

  • Данные получены из модели, представленной формулой в Formula свойство подгоняемой модели.

  • Наблюдения независимы, зависят от предикторных значений.

В этих предположениях пусть β представляет (неизвестный) вектор коэффициентов линейной регрессии. Предположим, что H является матрицей полного ранга размера r-by-s, где r - количество коэффициентов, включаемых в F-тест, а s - общее число коэффициентов. Пусть c - вектор столбца с r строками. Ниже приведена проверочная статистика для гипотезы, что  = c:

F = (^ c) (HVH ) 1 (Hβ ^ − c).

Здесь β ^ - оценка вектора коэффициентов β, хранящаяся в Coefficients свойство, а V - оценочная ковариация оценок коэффициентов, сохраненных в CoefficientCovariance собственность. Когда гипотеза верна, проверочная статистика F имеет F-распределение с r и u степенями свободы, где u - степени свободы для ошибки, хранящиеся в DFE собственность.

Альтернативная функциональность

Значения обычно используемой статистики тестирования доступны в Coefficients свойство подгоняемой модели.

Расширенные возможности

Представлен в R2012a