coefTest

Линейный тест гипотезы на обобщенных линейных коэффициентах модели регрессии

Описание

пример

p = coefTest(mdl) вычисляет p - значение для теста F, который весь коэффициент оценивает в mdl, кроме термина прерывания, нуль.

пример

p = coefTest(mdl,H) выполняет F - тестируют тот H × B = 0, где B представляет вектор коэффициентов. Используйте H задавать коэффициенты, чтобы включать в F - тест.

p = coefTest(mdl,H,C) выполняет F - тестируют тот H × B = C.

[p,F] = coefTest(___) также возвращается, F - тестируют статистический F использование любой из комбинаций входных аргументов в предыдущих синтаксисах.

[p,F,r] = coefTest(___) также возвращает степени свободы числителя r для теста.

Примеры

свернуть все

Подбирайте обобщенную линейную модель регрессии и протестируйте коэффициенты подобранной модели, чтобы видеть, отличаются ли они от нуля.

Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную линейную модель регрессии данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Протестируйте, имеет ли подобранная модель коэффициенты, которые значительно отличаются от нуля.

p = coefTest(mdl)
p = 4.1131e-153

Маленькое p-значение указывает, что модель соответствует значительно лучше, чем вырожденная модель, состоящая только из термина прерывания.

Подбирайте обобщенную линейную модель регрессии и протестируйте значение заданного коэффициента в подобранной модели.

Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную линейную модель регрессии данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Протестируйте значение x1 коэффициент. Согласно отображению модели, x1 второй предиктор. Задайте коэффициент при помощи числового вектора индекса.

p = coefTest(mdl,[0 1 0])
p = 2.8681e-145

Возвращенное p-значение указывает на тот x1 является статистически значительным в подобранной модели.

Входные параметры

свернуть все

Обобщенная линейная модель регрессии в виде GeneralizedLinearModel объект, созданный с помощью fitglm или stepwiseglm, или CompactGeneralizedLinearModel объект, созданный с помощью compact.

Матрица гипотезы в виде r- s числовая матрица индекса, где r количество коэффициентов, чтобы включать в F - тест и s общее количество коэффициентов.

  • Если вы задаете H, затем выход p p - значение для F - тестирует тот H × B = 0, где B представляет вектор коэффициентов.

  • Если вы задаете H и C, затем выход p p - значение для F - тестирует тот H × B = C.

Пример: [1 0 0 0 0] тестирует первый коэффициент среди пяти коэффициентов.

Типы данных: single | double

Предполагавшееся значение для тестирования нулевой гипотезы в виде числового вектора с одинаковым числом строк как H.

Если вы задаете H и C, затем выход p p - значение для F - тестирует тот H × B = C, где B представляет вектор коэффициентов.

Типы данных: single | double

Выходные аргументы

свернуть все

p - значение для F - тест, возвращенный как числовое значение в области значений [0,1].

Значение тестовой статистической величины для F - тест, возвращенный как числовое значение.

Степени свободы числителя для F - тест, возвращенный как положительное целое число. F - статистическая величина имеет r степени свободы в числителе и mdl.DFE степени свободы в знаменателе.

Алгоритмы

p - значение, F - статистическая величина и степени свободы числителя допустимы под этими предположениями:

  • Данные прибывают из модели, представленной формулой в Formula свойство подобранной модели.

  • Наблюдения независимы, условны на значениях предиктора.

Под этими предположениями позвольте β представлять (неизвестный) вектор коэффициентов линейной регрессии. Предположим, что H является матрицей полного ранга размера r-by-s, где r является количеством коэффициентов, чтобы включать в F - тест, и s является общим количеством коэффициентов. Позвольте c быть вектор-столбцом со строками r. Следующее является тестовой статистической величиной для гипотезы что  = c:

F=(Hβ^c)(HVH)1(Hβ^c).

Здесь β^ оценка вектора коэффициентов β, сохраненный в Coefficients свойство и V являются предполагаемой ковариацией содействующих оценок, сохраненных в CoefficientCovariance свойство. Когда гипотеза верна, тестовая статистическая величина, F имеет Распределение F с r и степенями свободы u, где u является степенями свободы для ошибки, сохраненной в DFE свойство.

Альтернативная функциональность

Значения обычно используемой тестовой статистики доступны в Coefficients свойство подобранной модели.

Представленный в R2012a