Иерархические полиномиальные модели

Результат переменной отклика может иногда быть одним из ограниченного набора возможных значений. Если существует только два возможных результата, таких как мужчина и женщина для пола, эти ответы называются двоичными ответами. Если существует несколько результатов, то они называются политомными ответами. Эти ответы обычно являются качественными, а не количественными, такими как предпочтительные районы для проживания в городе, уровень тяжести заболевания, вид для определенного типа цветов и так далее. Политомные отклики могут также иметь категории, которые не независимы друг от друга. Вместо этого ответ происходит последовательно, или одна категория вложена в предыдущую. Эти типы откликов называются иерархическими, или последовательными, или вложенными полиномиальными откликами.

Например, если ответом является количество сигарет, которые человек курит в данный день, первый уровень - курильщик или нет. Учитывая, что он курил, количество сигарет, которые он курит, может быть от одного до пяти или более пяти в день. Учитывая, что это более 5, этот человек может курить от 6 до 10 или более 10 сигарет в день и так далее. Группа риска на каждом уровне изменяется соответствующим образом. На первом уровне группа риска является всей интересующими индивидуумами (курильщик или нет), скажем m. Если из m лиц y 1 из них не курильщики, то на втором уровне группой риска является количество всех курящих лиц, m - y 1. Если y 2 из этих m - y 1 особь курит от одной до пяти сигарет в день, то на третьем уровне группа риска m - y 1 - y 2. Таким образом, на каждом уровне количество людей в этой категории становится условным биномиальным наблюдением.

Иерархические полиномиальные регрессионые модели являются расширениями бинарных регрессионых моделей, основанных на условных двоичных наблюдениях. По умолчанию это модель с различными точками пересечения и склонами (коэффициентами) среди категорий, в этом случае mnrfit подходит для последовательности условных биномиальных моделей. The 'interactions','on' Пара "имя-значение" задает это в mnrfit. Функция ссылки по умолчанию является logit и 'link','logit' пара "имя-значение" задает эту модель в mnrfit.

Предположим вероятность, что индивидуум находится в категории j, учитывая, что он не находится в предыдущих категориях, πj и совокупная вероятность, что ответ принадлежит категории j, или предыдущая категория - P (y  <reservedrangesplaceholder1> <reservedrangesplaceholder0>). Тогда иерархическая модель с функцией ссылки logit и предположением о разных склонах

ln(π11P(yc1))=ln(π11π1)=α1+β11X1+β12X2++β1pXp,ln(π21P(yc2))=ln(π21(π1+π2))=α2+β21X2+β22X2++β2pXp,ln(πk11P(yck1))=ln(πk11(π1++πk1))=αk1+β(k1)1X1+β(k1)2X2++β(k1)pXp.

Для примера для переменной отклика с четырьмя последовательными категориями существует 4 - 1 = 3 уравнения следующим образом:

ln(π1π+2π+3π4)=α1+β11X1+β12X2++β1pXp,ln(π2π+3π4)=α2+β21X1+β22X2++β2pXp,ln(π3π4)=α3+β31X1+β32X2++β3pXp.

Коэффициенты β ij интерпретируются в каждом уровне. Например, для предыдущего примера курения, β 12 показывает влияние X 2 на логарифмические коэффициенты человека, являющегося курильщиком по сравнению с некурящим, при условии, что все остальное остается постоянным. Альтернативно, β 22 показывает влияние X 2 на логарифмические шансы человека, курящего от одной до пяти сигарет по сравнению с более чем пятью сигаретами в день, учитывая, что он или она курильщик, при условии, что все остальное удерживается постоянным. Аналогичным образом, β 23 показывает влияние X 2 на логарифмические шансы человека, курящего от 6 до 10 сигарет против более чем 10 сигарет в день, учитывая, что он курит более 5 сигарет в день, при условии, что все остальное поддерживается постоянным.

Можно задать другие функции ссылки для иерархических моделей. The 'link','probit' аргумент пары "имя-значение" использует функцию probit link. При допущении отдельных склонов модель становится

Φ1(π1)=α1+β11X1++β1pXp,Φ1(π2)=α2+β21X1++β2pXp,Φ1(πk)=αk+βk1X1++βkpXp,

где π j - условная вероятность нахождения в категории j, учитывая, что это не в категориях, предшествующих j категории. И-1(.) - обратная стандартная нормальная кумулятивная функция распределения.

После оценки коэффициентов модели используя mnrfitможно оценить совокупные вероятности или совокупное число в каждой категории с помощью mnrval с 'type','conditional' аргумент пары "имя-значение". Функция mnrval принимает оценки коэффициентов и статистику моделей mnrfit возвращает и оценивает категориальные вероятности или число в каждой категории и их доверительные границы. Можно задать, какую категорию или совокупные вероятности или числа оценить, изменив значение 'type' аргумент пары "имя-значение" в mnrval.

Ссылки

[1] McCullagh, P., and J. A. Nelder. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.

[2] Ляо, Т. Ф. Интерпретация моделей вероятностей: логит, пробит и другие обобщенные линейные модели серии: количественные приложения в социальных науках. Sage Publications, 1994.

См. также

| | | |

Похожие темы