Результатом переменной ответа иногда может быть одно из ограниченного набора возможных значений. Если есть только два возможных результата, таких как мужчина и женщина для пола, эти ответы называются бинарными ответами. Если есть несколько результатов, то они называются политомными ответами. Эти ответы обычно являются качественными, а не количественными, такими как предпочтительные районы для проживания в городе, уровень тяжести заболевания, вид для определенного типа цветка и так далее. Политомные ответы также могут иметь категории, которые не независимы друг от друга. Вместо этого ответ происходит последовательным образом, или одна категория вложена в предыдущую. Эти типы ответов называются иерархическими, или последовательными, или вложенными полиномиальными ответами.
Например, если ответ - это количество сигарет, которые человек курит в данный день, первый уровень - является ли человек курильщиком или нет. Учитывая, что он или она курильщик, количество сигарет, которые он или она курит, может быть от одной до пяти или более пяти в день. Учитывая, что это более 5, этот человек может курить от 6 до 10 или более 10 сигарет в день и так далее. Группа риска на каждом уровне изменяется соответствующим образом. На первом уровне группа риска - это все лица, представляющие интерес (курильщик или нет), скажем м. Если из m человек, y1 из них не курильщики, то на втором уровне группа риска - это количество всех курящих людей, m - y1. Если y2 из этих m - y1 особей курят от одной до пяти сигарет в день, то на третьем уровне группа риска составляет m - y1 - y2. Так, на каждом уровне количество людей в этой категории становится условным биномиальным наблюдением.
Иерархические полиномиальные регрессионные модели являются расширениями бинарных регрессионных моделей, основанных на условных двоичных наблюдениях. По умолчанию используется модель с различными пересечениями и уклонами (коэффициентами) между категориями, в этом случае mnrfit подходит для последовательности условных биномиальных моделей. 'interactions','on' пара имя-значение указывает это в mnrfit. Функция канала по умолчанию - logit и 'link','logit' пара имя-значение определяет эту модель в mnrfit.
Предположим, что вероятность того, что индивид находится в категории j, учитывая, что он или она не находится в предыдущих категориях, равна ¼ j, и кумулятивная вероятность того, что ответ принадлежит к категории j или предыдущей категории, равна P (y ≤ cj). Тогда иерархическая модель с функцией логитовой связи и различными уклонами предполагается
(k−1) 2X2 + ⋯ +β (k−1) pXp.
Например, для переменной ответа с четырьмя последовательными категориями существуют 4-1 = 3 уравнения следующим образом:
=α3+β31X1+β32X2+⋯+β3pXp.
Коэффициенты βij интерпретируются в пределах каждого уровня. Например, для предыдущего примера курения β12 показывает влияние X2 на логарифмические шансы человека, являющегося курильщиком, по сравнению с некурящим, при условии, что все остальное поддерживается постоянным. Альтернативно, β22 показывает влияние X2 на логарифмические шансы человека, курящего от одной до пяти сигарет, по сравнению с более чем пятью сигаретами в день, учитывая, что он или она является курильщиком, при условии, что все остальное поддерживается постоянным. Аналогично, β23 показывает влияние X2 на логарифмические шансы человека, курящего от 6 до 10 сигарет, по сравнению с более чем 10 сигаретами в день, учитывая, что он или она курит более 5 сигарет в день, при условии, что все остальное поддерживается постоянным.
Для иерархических моделей можно указать другие функции связи. 'link','probit' аргумент пары имя-значение использует функцию пробит-связи. При допущении отдельных откосов модель становится
=αk+βk1X1+⋯+βkpXp,
где αj - условная вероятность нахождения в категории j, учитывая, что она не в категориях, предшествующих категории j. И Φ-1 (.) является обратной стандартной нормальной кумулятивной функции распределения.
После оценки коэффициентов модели с использованием mnrfit, можно оценить кумулятивные вероятности или кумулятивное число в каждой категории, используя mnrval с 'type','conditional' аргумент пары имя-значение. Функция mnrval принимает оценки коэффициентов и статистику модели mnrfit возвращает и оценивает категориальные вероятности или число в каждой категории и их доверительные границы. Можно указать категорию или совокупные вероятности или числа для оценки, изменив значение 'type' аргумент пары имя-значение в mnrval.
[1] Маккалла, П. и Дж. А. Нелдер. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.
[2] Ляо, Т. Ф. Интерпретация вероятностных моделей: серии логит, пробит и другие обобщенные линейные модели: количественное применение в социальных науках. Sage Publications, 1994.
fitglm | glmfit | glmval | mnrfit | mnrval