Результатом переменной ответа может быть одно из ограниченного набора возможных значений. Если есть только два возможных результата, таких как да или нет ответа на вопрос, эти ответы называются бинарными ответами. Если есть несколько результатов, то они называются политомными ответами. Некоторые примеры включают степень заболевания (легкой, средней, тяжелой), предпочтительные районы для проживания в городе и так далее. Когда переменная отклика является номинальной, среди категорий переменных отклика отсутствует естественный порядок. Модели номинального ответа объясняют и предсказывают вероятность того, что наблюдение находится в каждой категории категориальной переменной ответа.
Модель номинального отклика является одним из нескольких естественных расширений модели двоичного логита и также называется моделью полиномиального логита. Модель полиномиального логита объясняет относительный риск нахождения в одной категории по сравнению с пребыванием в эталонной категории k, используя линейную комбинацию переменных предиктора. Следовательно, вероятность каждого результата выражается как нелинейная функция переменных p-предиктора. 'interactions','on' аргумент пары имя-значение в mnrfit соответствует этой полиномиальной модели с отдельными перехватами и уклонами между категориями. mnrfit использует функцию logit link по умолчанию для полиномиальных моделей. Нельзя указать другую функцию связи для полиномиальных ответов.
Модель полиномиального логита
k − 1) 2X2+⋯+β (k − 1) pXp,
где § j = P (y = j) - вероятность того, что результат находится в категории j, k - число категорий ответа, а p - число переменных предиктора. Теоретически любая категория может быть ссылочной, но mnrfit выбирает последнюю, k, в качестве ссылочной категории. Таким образом, mnrfit предполагает, что коэффициенты k-ой категории равны нулю. Сумма уравнений j-1 решается одновременно для оценки коэффициентов. mnrfit использует итерационно взвешенный алгоритм наименьших квадратов, чтобы найти оценки максимального правдоподобия.
Коэффициенты в модели выражают влияние переменных предиктора на относительный риск или логарифмические шансы быть в категории j по сравнению с эталонной категорией, здесь k. Например, коэффициент β23 указывает, что вероятность того, что переменная отклика находится в категории 2 по сравнению с вероятностью нахождения в категории k, увеличивается exp (β23) раз для каждого единичного увеличения X3, учитывая, что все остальное поддерживается постоянным. Или это указывает на то, что относительные логарифмические коэффициенты переменной ответа, относящейся к категории 2, по сравнению с категорией k, увеличиваются β23 раза с единичным увеличением X3, учитывая все остальные равные.
На основе модели номинального ответа и предположения, что коэффициенты для последней категории равны нулю, вероятность нахождения в каждой категории равна
j=1,⋯,k−1.
Вероятность k-ой категории становится
=11+∑j=1k−1eαj+∑l=1pβjlxl,
что просто равно 1 - ¼ 1 - α2 -... - ¼ к-1.
После оценки коэффициентов модели с использованием mnrfit, можно оценить вероятности категорий или число в каждой категории, используя mnrval (пара имя-значение по умолчанию 'type','category'). Эта функция принимает оценки коэффициентов и статистику модели. mnrfit возвращает и оценивает категориальные вероятности или число в каждой категории и их доверительные границы. Можно также указать кумулятивные или условные вероятности или числа для оценки с помощью 'type' аргумент пары имя-значение в mnrval.
[1] Маккалла, П. и Дж. А. Нелдер. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.
[2] Long, J.S. Регрессионные модели для категориальных и ограниченных зависимых переменных. Sage Publications, 1997.
[3] Добсон, A. J. и А. Г. Барнетт. Введение в обобщенные линейные модели. Чепмен и Холл/КПР. Taylor & Francis Group, 2008.
fitglm | glmfit | glmval | mnrfit | mnrval