devianceTest

Анализ отклонения для обобщенной линейной модели регрессии

Синтаксис

Описание

пример

tbl = devianceTest(mdl) возвращает анализ таблицы отклонения для обобщенной линейной модели mdl регрессии. Таблица tbl дает результат теста, который определяет ли модель mdl подгонки значительно лучше, чем постоянная модель.

Примеры

свернуть все

Выполните тест отклонения на обобщенной линейной модели регрессии.

Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную линейную модель регрессии данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Протестируйте, отличается ли модель от константы статистически значительным способом.

tbl = devianceTest(mdl)
tbl=2×4 table
                             Deviance     DFE     chi2Stat     pValue
                            __________    ___    __________    ______

    log(y) ~ 1              2.9544e+05    99                         
    log(y) ~ 1 + x1 + x2         107.4    97     2.9533e+05       0  

Маленькое p-значение указывает, что модель значительно отличается от константы. Обратите внимание на то, что отображение модели mdl включает статистику, показанную во вторую строку таблицы.

Входные параметры

свернуть все

Обобщенная линейная модель регрессии в виде GeneralizedLinearModel объект, созданный с помощью fitglm или stepwiseglm, или CompactGeneralizedLinearModel объект, созданный с помощью compact.

Выходные аргументы

свернуть все

Анализ статистики сводных данных отклонения, возвращенной как таблица.

tbl содержит анализ статистики отклонения и для постоянной модели и для модели mdl. Таблица включает эти столбцы для каждой модели.

СтолбецОписание
Deviance

Отклонение является дважды различием между логарифмической правдоподобностью соответствующей модели (mdl или постоянный) и влажная модель. Для получения дополнительной информации смотрите Отклонение.

DFE

Степени свободы для ошибки (остаточные значения), равняйтесь np, где n является количеством наблюдений, и p является количеством предполагаемых коэффициентов

chi2Stat

F - статистическая или статистическая величина в квадрате хи, в зависимости от того, оценивается ли дисперсия (F - статистическая величина) или не (статистическая величина в квадрате хи)

  • F- является различием между отклонением постоянной модели и отклонением полной модели, разделенной на предполагаемую дисперсию.

  • Статистическая величина в квадрате хи является различием между отклонением постоянной модели и отклонением полной модели.

pValue

p - значение сопоставило с тестом: статистическая величина в квадрате хи с p – 1 степенью свободы, или F - статистической величиной с p – 1 степень свободы числителя и DFE степени свободы знаменателя, где p является количеством предполагаемых коэффициентов

Больше о

свернуть все

Отклонение

Отклонение модели M 1 является дважды различием между логарифмической правдоподобностью модели M 1 и влажной моделью M s. Влажная модель является моделью с максимальным количеством параметров, которые можно оценить.

Например, если у вас есть наблюдения n (y i, i = 1, 2..., n) с потенциально различными значениями для X i , затем можно задать влажную модель параметрами n. Позвольте L (b, y) обозначают максимальное значение функции правдоподобия для модели параметрами b. Затем отклонение модели M 1

2(logL(b1,y)logL(bS,y)),

где b 1 и b s содержит предполагаемые параметры для модели M 1 и влажной модели, соответственно. Отклонение имеет распределение хи-квадрат с nстепени свободы p, где n является количеством параметров во влажной модели, и p является количеством параметров в модели M 1.

Примите, что у вас есть две различных обобщенных линейных модели M регрессии 1 и M 2, и M 1 имеет подмножество условий в M 2. Можно оценить припадок моделей путем сравнения отклонений D 1 и D 2 из этих двух моделей. Различие отклонений

D=D2D1=2(logL(b2,y)logL(bS,y))+2(logL(b1,y)logL(bS,y))=2(logL(b2,y)logL(b1,y)).

Асимптотически, различие D имеет распределение хи-квадрат со степенями свободы v, равный различию в количестве параметров, оцененных в M 1 и M 2. Можно получить p - значение для этого теста при помощи   1 – chi2cdf(D,v).

Как правило, вы исследуете D с помощью модели M 2 с постоянным термином и никакими предикторами. Поэтому D имеет распределение хи-квадрат с p – 1 степень свободы. Если дисперсия оценивается, различие, разделенное на предполагаемую дисперсию, имеет распределение F с p – 1 степенью свободы числителя и nстепени свободы знаменателя p.

Представленный в R2012a