devianceTest

Анализ отклонения для обобщенной линейной модели регрессии

Синтаксис

tbl = devianceTest(mdl)

Описание

tbl = devianceTest(mdl) возвращает анализ таблицы отклонения для обобщенной линейной модели mdl регрессии. Таблица tbl дает результат теста, который определяет ли модель mdl подгонки значительно лучше, чем постоянная модель.

Примеры

свернуть все

Выполните тест отклонения

Скрипт Open Live Script

Выполните тест отклонения на обобщенной линейной модели регрессии.

Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1) и X(:,2).

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

Создайте обобщенную линейную модель регрессии данных Пуассона.

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')

mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

Протестируйте, отличается ли модель от константы статистически значительным способом.

tbl = devianceTest(mdl)

tbl=2×4 table
                             Deviance     DFE     chi2Stat     pValue
                            __________    ___    __________    ______

    log(y) ~ 1              2.9544e+05    99                         
    log(y) ~ 1 + x1 + x2         107.4    97     2.9533e+05       0

Маленькое p-значение указывает, что модель значительно отличается от константы. Обратите внимание на то, что отображение модели mdl включает статистику, показанную во вторую строку таблицы.

Входные параметры

свернуть все

`mdl` — Обобщенная линейная модель регрессии
`GeneralizedLinearModel` возразите | `CompactGeneralizedLinearModel` объект

Обобщенная линейная модель регрессии в виде GeneralizedLinearModel объект создал использование fitglm или stepwiseglm, или CompactGeneralizedLinearModel объект, созданный с помощью compact.

Выходные аргументы

свернуть все

`tbl` — Анализ статистики сводных данных отклонения
таблица

Анализ статистики сводных данных отклонения, возвращенной как таблица.

tbl содержит анализ статистики отклонения и для постоянной модели и для модели mdl. Таблица включает эти столбцы для каждой модели.

Столбец	Описание
`Deviance`	Отклонение является дважды различием между логарифмической правдоподобностью соответствующей модели (`mdl` или постоянный) и влажная модель. Для получения дополнительной информации смотрите Отклонение.
`DFE`	Степени свободы для ошибки (остаточные значения), равняйтесь n – p, где n является количеством наблюдений, и p является количеством предполагаемых коэффициентов
`chi2Stat`	F - статистическая или статистическая величина в квадрате хи, в зависимости от того, оценивается ли дисперсия (F - статистическая величина) или не (статистическая величина в квадрате хи) F- является различием между отклонением постоянной модели и отклонением полной модели, разделенной на предполагаемую дисперсию. Статистическая величина в квадрате хи является различием между отклонением постоянной модели и отклонением полной модели.
`pValue`	p - значение сопоставило с тестом: статистическая величина в квадрате хи с p – 1 степенью свободы, или F - статистической величиной с p – 1 степень свободы числителя и `DFE` степени свободы знаменателя, где p является количеством предполагаемых коэффициентов

Больше о

свернуть все

Отклонение

Отклонение является обобщением остаточной суммы квадратов. Это измеряет качество подгонки по сравнению с влажной моделью.

Отклонение модели M₁ является дважды различием между логарифмической правдоподобностью модели M₁ и влажной моделью M _s. Влажная модель является моделью с максимальным количеством параметров, которые можно оценить.

Например, если у вас есть наблюдения n (y _i, i = 1, 2..., n) с потенциально различными значениями для X _i^Tβ, затем можно задать влажную модель параметрами n. Позвольте L (b, y) обозначают максимальное значение функции правдоподобия для модели параметрами b. Затем отклонение модели M₁

$- 2 (\log L (b_{1}, y) - \log L (b_{S}, y)),$

где b ₁ и b _s содержит предполагаемые параметры для модели M₁ и влажной модели, соответственно. Отклонение имеет распределение хи-квадрат с n – степени свободы p, где n является количеством параметров во влажной модели, и p является количеством параметров в модели M₁.

Примите, что у вас есть две различных обобщенных линейных модели M регрессии ₁ и M ₂, и M ₁ имеет подмножество терминов в M ₂. Можно оценить припадок моделей путем сравнения отклонений D ₁ и D ₂ из этих двух моделей. Различие отклонений

$\begin{array}{l} D = D_{2} - D_{1} = - 2 (\log L (b_{2}, y) - \log L (b_{S}, y)) + 2 (\log L (b_{1}, y) - \log L (b_{S}, y)) \\ = - 2 (\log L (b_{2}, y) - \log L (b_{1}, y)) . \end{array}$

Асимптотически, различие D имеет распределение хи-квадрат со степенями свободы v, равный различию в количестве параметров, оцененных в M ₁ и M ₂. Можно получить p - значение для этого теста при помощи 1 – chi2cdf(D,v).

Как правило, вы исследуете D с помощью модели M₂ с постоянным термином и никакими предикторами. Поэтому D имеет распределение хи-квадрат с p – 1 степень свободы. Если дисперсия оценивается, различие, разделенное на предполагаемую дисперсию, имеет распределение F с p – 1 степенью свободы числителя и n – степени свободы знаменателя p.

Расширенные возможности

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Указания и ограничения по применению:

Эта функция поддерживает объекты модели, снабженные входными параметрами графического процессора массивов.

Для получения дополнительной информации смотрите функции MATLAB Запуска на графическом процессоре (Parallel Computing Toolbox).

Документация

devianceTest

Синтаксис

Описание

Примеры

Выполните тест отклонения

Входные параметры

`mdl` — Обобщенная линейная модель регрессии
`GeneralizedLinearModel` возразите | `CompactGeneralizedLinearModel` объект

Выходные аргументы

`tbl` — Анализ статистики сводных данных отклонения
таблица

Больше о

Отклонение

Расширенные возможности

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Темы

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

devianceTest

Синтаксис

Описание

Примеры

Выполните тест отклонения

Входные параметры

mdl — Обобщенная линейная модель регрессии GeneralizedLinearModel возразите | CompactGeneralizedLinearModel объект

Выходные аргументы

tbl — Анализ статистики сводных данных отклонения таблица

Больше о

Отклонение

Расширенные возможности

Массивы графического процессора Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Темы

Документация Statistics and Machine Learning Toolbox

Поддержка

`mdl` — Обобщенная линейная модель регрессии
`GeneralizedLinearModel` возразите | `CompactGeneralizedLinearModel` объект

`tbl` — Анализ статистики сводных данных отклонения
таблица

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.