Анализ отклонения для обобщенной линейной модели регрессии
Выполните тест отклонения на обобщенной линейной модели регрессии.
Сгенерируйте выборочные данные с помощью случайных чисел Пуассона с двумя базовыми предикторами X(:,1)
и X(:,2)
.
rng('default') % For reproducibility rndvars = randn(100,2); X = [2 + rndvars(:,1),rndvars(:,2)]; mu = exp(1 + X*[1;2]); y = poissrnd(mu);
Создайте обобщенную линейную модель регрессии данных Пуассона.
mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = Generalized linear regression model: log(y) ~ 1 + x1 + x2 Distribution = Poisson Estimated Coefficients: Estimate SE tStat pValue ________ _________ ______ ______ (Intercept) 1.0405 0.022122 47.034 0 x1 0.9968 0.003362 296.49 0 x2 1.987 0.0063433 313.24 0 100 observations, 97 error degrees of freedom Dispersion: 1 Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0
Протестируйте, отличается ли модель от константы статистически значительным способом.
tbl = devianceTest(mdl)
tbl=2×4 table
Deviance DFE chi2Stat pValue
__________ ___ __________ ______
log(y) ~ 1 2.9544e+05 99
log(y) ~ 1 + x1 + x2 107.4 97 2.9533e+05 0
Маленькое p-значение указывает, что модель значительно отличается от константы. Обратите внимание на то, что отображение модели mdl
включает статистику, показанную во вторую строку таблицы.
mdl
— Обобщенная линейная модель регрессииGeneralizedLinearModel
возразите | CompactGeneralizedLinearModel
объектОбобщенная линейная модель регрессии в виде GeneralizedLinearModel
объект создал использование fitglm
или stepwiseglm
, или CompactGeneralizedLinearModel
объект, созданный с помощью compact
.
tbl
— Анализ статистики сводных данных отклоненияАнализ статистики сводных данных отклонения, возвращенной как таблица.
tbl
содержит анализ статистики отклонения и для постоянной модели и для модели mdl
. Таблица включает эти столбцы для каждой модели.
Столбец | Описание |
---|---|
Deviance | Отклонение является дважды различием между логарифмической правдоподобностью соответствующей модели ( |
DFE | Степени свободы для ошибки (остаточные значения), равняйтесь n – p, где n является количеством наблюдений, и p является количеством предполагаемых коэффициентов |
chi2Stat | F - статистическая или статистическая величина в квадрате хи, в зависимости от того, оценивается ли дисперсия (F - статистическая величина) или не (статистическая величина в квадрате хи)
|
pValue | p - значение сопоставило с тестом: статистическая величина в квадрате хи с p – 1 степенью свободы, или F - статистической величиной с p – 1 степень свободы числителя и |
Отклонение является обобщением остаточной суммы квадратов. Это измеряет качество подгонки по сравнению с влажной моделью.
Отклонение модели M 1 является дважды различием между логарифмической правдоподобностью модели M 1 и влажной моделью M s. Влажная модель является моделью с максимальным количеством параметров, которые можно оценить.
Например, если у вас есть наблюдения n (y i, i = 1, 2..., n) с потенциально различными значениями для X i Tβ, затем можно задать влажную модель параметрами n. Позвольте L (b, y) обозначают максимальное значение функции правдоподобия для модели параметрами b. Затем отклонение модели M 1
где b 1 и b s содержит предполагаемые параметры для модели M 1 и влажной модели, соответственно. Отклонение имеет распределение хи-квадрат с n – степени свободы p, где n является количеством параметров во влажной модели, и p является количеством параметров в модели M 1.
Примите, что у вас есть две различных обобщенных линейных модели M регрессии 1 и M 2, и M 1 имеет подмножество условий в M 2. Можно оценить припадок моделей путем сравнения отклонений D 1 и D 2 из этих двух моделей. Различие отклонений
Асимптотически, различие D имеет распределение хи-квадрат со степенями свободы v, равный различию в количестве параметров, оцененных в M 1 и M 2. Можно получить p - значение для этого теста при помощи 1 – chi2cdf(D,v)
.
Как правило, вы исследуете D с помощью модели M 2 с постоянным термином и никакими предикторами. Поэтому D имеет распределение хи-квадрат с p – 1 степень свободы. Если дисперсия оценивается, различие, разделенное на предполагаемую дисперсию, имеет распределение F с p – 1 степенью свободы числителя и n – степени свободы знаменателя p.
Указания и ограничения по применению:
Эта функция поддерживает объекты модели, снабженные входными параметрами графического процессора массивов.
Для получения дополнительной информации смотрите функции MATLAB Запуска на графическом процессоре (Parallel Computing Toolbox).
coefTest
| CompactGeneralizedLinearModel
| GeneralizedLinearModel
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.