Полиномиальные модели для порядковых реакций

Результат переменной отклика может быть одним из ограниченного набора возможных значений. Если существует только два возможных результата, таких как мужчина и женщина для пола, эти ответы называются двоичными ответами. Если существует несколько результатов, то они называются политомными ответами. Некоторые примеры политомных реакций включают уровни заболевания (легкий, средний, тяжелый), предпочтительные районы для проживания в городе, вид для определенного типа цветов и так далее. Иногда среди категорий ответов может быть естественный порядок. Эти ответы называются порядковыми.

Это упорядоченное расположение может быть присущим выбору категории, например, индивидуум, не удовлетворяющее, удовлетворяющее или очень удовлетворяющее онлайн-службу поддержки клиентов. Это упорядоченное расположение также может быть введен путем классификации латентной (непрерывной) переменной, такой как в случае индивидуума, находящейся в группе низкого риска, среднего риска или высокого риска развития определенного заболевания, на основе количественной медицинской меры, такой как артериальное давление.

Можно задать полиномиальную регрессионую модель, которая использует естественное упорядоченное расположение среди категорий отклика. Эта порядковая модель описывает связь между совокупными вероятностями переменных категорий и предиктора.

Различные функции ссылки могут описать эту связь с logit и probit, которые являются наиболее используемыми.

  • Logit: Функция ссылки по умолчанию mnrfit для порядковых категорий используется функция logit link. Это моделирует логарифмические совокупные шансы. The 'link','logit' Пара "имя-значение" задает это в mnrfit. Зарегистрируйтесь совокупные разногласия логарифм отношения вероятности, что ответ принадлежит категории со значением, меньше чем или равным категории j, P (y  <reservedrangesplaceholder5> <reservedrangesplaceholder4>), и вероятность, что ответ принадлежит категории со значением, больше, чем категория j, P (y> <reservedrangesplaceholder1> <reservedrangesplaceholder0>).

    Порядковые модели обычно основаны на предположении, что эффекты переменных одинаковы для всех категорий в логарифмической шкале. То есть модель имеет различные точки пересечения, но общие склоны (коэффициенты) среди категорий. Эта модель называется параллельной регрессией или моделью пропорциональных шансов. Это значение по умолчанию для порядковых ответов и 'interactions','off' пара "имя-значение" задает эту модель в mnrfit.

    Модель пропорциональных шансов

    ln(P(yc1)P(y>c1))=ln(π1π2++πk)=α1+β1X1+β2X2++βpXp,ln(P(yc2)P(y>c2))=ln(π1+π2π3++πk)=α2+β1X1+β2X2++βpXp,ln(P(yck1)P(y>ck1))=ln(π1+π2++πk1πk)=αk1+β1X1+β2X2++βpXp,

    где πj, j = 1, 2,..., k, являются вероятностями категории.

    Для примера для переменной отклика с тремя категориями существует 3 - 1 = 2 уравнения следующим образом:

    ln(π1π+2π3)=α1+β1X1+β2X2++βpXp,ln(π+1π2π3)=α2+β1X1+β2X2++βpXp.

    При предположении пропорциональных шансов частичный эффект X переменной предиктора инвариантен выбору категории переменной отклика, j. Например, если существует три категории, коэффициенты выражают влияние переменной-предиктора на относительный риск или логарифмический коэффициент значения отклика в категории 1 от категорий 2 или 3 или в категории 1 или 2 от категории 3.

    Таким образом, модуль изменение переменной X 2 будет означать изменение совокупных шансов значения отклика в категории 1 от категорий 2 или 3, или категории 1 или 2 от категории 3 множителем exp (β 2), учитывая все остальные равные.

    Можно также подгонять модель с различными точками пересечения и склонами среди категорий с помощью 'interactions','on' аргумент пары "имя-значение". Однако использование этой опции для порядковых моделей, когда модель равных склонов верна, вызывает потерю эффективности (вы теряете преимущество оценки меньшего количества параметров).

  • Пробит: The 'link','probit' аргумент пары "имя-значение" использует функцию probit link, которая основана на обычно распределенном латентном предположении переменной. Для переменных порядкового отклика это также называется упорядоченной моделью пробита. Рассмотрим регрессионую модель, которая описывает отношение латентной переменной y * порядкового процесса и вектора переменных предиктора, X,

    y*=βX+ε,

    где термин « ошибка» ε имеет стандартное нормальное распределение. Предположим, что существует следующая связь между латентной переменной y * и наблюдаемой y переменной:

    y=c1ifα0<y*α1,y=c2ifα1<y*α2,y=ckifαk1<y*αk,

    где α 0 = - ∞ и α k = ∞. Затем совокупная вероятность y, находящегося в категории j или одна из более ранних категорий, P (y  <reservedrangesplaceholder1> <reservedrangesplaceholder0>), равна

    P(ycj)=P(y*<αj)=P(βX+ε<αj)=P(ε<αjβX)=Φ(αjβX),

    her- стандартная нормальная кумулятивная функция распределения. Таким образом,

    Φ1(P(ycj))=αjβX,

    где αj соответствует точкам разреза латентной переменной и точки пересечения в регрессионой модели. Это происходит только при допущениях нормальной скрытой переменной и параллельной регрессии. В целом, для переменной отклика с k категориями и несколькими предикторами, упорядоченная модель probit

    Φ1(P(yc1))=α1+β1X1++βpXp,Φ1(P(yc2))=α2+β1X1++βpXp,Φ1(P(yck1))=αk1+β1X1++βpXp,

    где P (y  <reservedrangesplaceholder5> <reservedrangesplaceholder4>) = <reservedrangesplaceholder3> 1 + <reservedrangesplaceholder2> 2 +... + <reservedrangesplaceholder1> <reservedrangesplaceholder0>.

    Коэффициенты указывают влияние модуля изменения переменной предиктора на вероятность состояния. Положительный коэффициент, β 1, для примера, указывает на увеличение базовой скрытой переменной с увеличением соответствующей переменной предиктора, X 1. Следовательно, это вызывает уменьшение в P (y  <reservedrangesplaceholder3> 1) и увеличение в P (y  <reservedrangesplaceholder1> <reservedrangesplaceholder0>).

После оценки коэффициентов модели используя mnrfitможно оценить совокупные вероятности или совокупное число в каждой категории с помощью mnrval с 'type','cumulative' пара "имя-значение". mnrval принимает оценки коэффициентов и статистику моделей mnrfit возвращает и оценивает категориальные вероятности или число в каждой категории и их доверительные интервалы. Можно задать, какую категорию или условные вероятности или числа оценить, изменив значение 'type' аргумент пары "имя-значение".

Ссылки

[1] McCullagh, P., and J. A. Nelder. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.

[2] Длинные регрессионые модели Дж. С. для категориальных и ограниченно зависимых переменных. Sage Publications, 1997.

[3] Добсон, А. Дж., и А. Г. Барнетт. Введение в обобщенные линейные модели. Чепмен и Холл/CRC. Taylor & Francis Group, 2008.

См. также

| | | |

Похожие темы