coefTest

Линейный тест гипотезы на обобщенных коэффициентах линейной регрессионой модели

Описание

пример

p = coefTest(mdl) вычисляет p -value для теста F, который все коэффициенты оценивают в mdl, кроме термина точки пересечения, равны нулю.

пример

p = coefTest(mdl,H) выполняет F -test, который H × B = 0, где B представляет вектор коэффициента. Использование H задать коэффициенты для включения в F -test.

p = coefTest(mdl,H,C) выполняет F -test, который H × B = C .

[p,F] = coefTest(___) также возвращает F -test statistic F использование любой комбинации входных аргументов в предыдущих синтаксисах.

[p,F,r] = coefTest(___) также возвращает числитель степеней свободы r для теста.

Примеры

свернуть все

Подбирайте обобщенную линейную регрессионую модель и проверяйте коэффициенты подобранной модели, чтобы увидеть, отличаются ли они от нуля.

Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную линейную регрессионую модель данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Проверьте, имеет ли подобранная модель коэффициенты, которые значительно отличаются от нуля.

p = coefTest(mdl)
p = 4.1131e-153

Маленькое значение p указывает, что модель подходит значительно лучше, чем вырожденная модель, состоящая только из члена точки пересечения.

Подбирайте обобщенную линейную регрессионую модель и проверяйте значимость заданного коэффициента в подобранной модели.

Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную линейную регрессионую модель данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Проверьте значимость x1 коэффициент. Согласно отображения модели, x1 является вторым предиктором. Задайте коэффициент при помощи числового вектора индекса.

p = coefTest(mdl,[0 1 0])
p = 2.8681e-145

Возвращенное значение p указывает, что x1 является статистически значимым в подобранной модели.

Входные параметры

свернуть все

Обобщенная линейная регрессионая модель, заданная как GeneralizedLinearModel объект, созданный с помощью fitglm или stepwiseglm, или CompactGeneralizedLinearModel объект, созданный с помощью compact.

Матрица гипотез, заданная как r-by- s матрица числового индекса, где r - количество коэффициентов, включаемых в F -test, и s - общее количество коэффициентов.

  • Если вы задаете H, затем выход p p - оценивают за F - проверяют тот <reservedrangesplaceholder2> × <reservedrangesplaceholder1> = 0, где B представляет содействующий вектор.

  • Если вы задаете H и C, затем выход p p - оценивают за F - проверяют тот <reservedrangesplaceholder2> × <reservedrangesplaceholder1> = C.

Пример: [1 0 0 0 0] проверяет первый коэффициент среди пяти коэффициентов.

Типы данных: single | double

Гипотезированное значение для проверки гипотезы null, заданное как числовой вектор с одинаковым числом строк, как H.

Если вы задаете H и C, затем выход p p - оценивают за F - проверяют тот <reservedrangesplaceholder3> × <reservedrangesplaceholder2> = C, где B представляет содействующий вектор.

Типы данных: single | double

Выходные аргументы

свернуть все

p -value для F -test, возвращенный как числовое значение в области значений [0,1].

Значение тестовой статистики для F -test, возвращаемое в виде числового значения.

Числитель степеней свободы для F -test, возвращается как положительное целое число. У F-statistic r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

p -значение, F -statistic и степени свободы числителя действительны при этих предположениях:

  • Данные получены из модели, представленной формулой в Formula свойство подобранной модели.

  • Наблюдения являются независимыми, обусловленными значениями предиктора.

В этих предположениях позвольте β представлять (неизвестный) вектор коэффициента линейной регрессии. Предположим H что это матрица полного ранга размера r -by- s, где r - количество коэффициентов, включаемых в F -test, и s - общее количество коэффициентов. Позвольте c быть вектором-столбцом с r строками. Следующее является тестовой статистикой для гипотезы, что  Hβ = c:

F=(Hβ^c)(HVH)1(Hβ^c).

Здесь β^ - оценка вектора β, сохраненная в Coefficients свойство, и V является оценочной ковариацией оценок коэффициентов, сохраненных в CoefficientCovariance свойство. Когда гипотеза верна, тестовая статистическая F имеет F- Распределения с r и u степенями свободы, где u - степени свободы от ошибки, сохраненные в DFE свойство.

Альтернативная функциональность

Значения обычно используемой тестовой статистики доступны в Coefficients свойство подобранной модели.

Расширенные возможности

Введенный в R2012a