exponenta event banner

Модель пропорциональных рисков Кокса

Введение

Регрессия пропорциональных рисков Кокса является полупараметрическим методом для корректировки оценок выживаемости для количественной оценки влияния предикторных переменных. Метод представляет эффекты пояснительных переменных как множитель общей базовой функции опасности h0 (t). Функция опасности является непараметрической частью функции регрессии пропорциональных рисков Кокса, в то время как влияние переменных предиктора является логлинейной регрессией. Для базовой линии относительно 0 эта модель соответствует

h (Xi, t) = h0 (t) exp[∑j=1pxijbj],

где Xi = (xi1,xi2,⋯,xip) - предикторная переменная для i-го субъекта, h (Xi, t) - коэффициент опасности в момент времени t для Xi, и h0 (t) - функция базового коэффициента опасности.

Коэффициент опасности

Модель пропорциональных рисков Кокса связывает уровень опасности для отдельных лиц или элементов со значением Xi с уровнем опасности для отдельных лиц или элементов с базовым значением. Он дает оценку коэффициента опасности:

HR (Xi) = h (Xi, t) h0 (t) =exp[∑j=1pxijbj].

Модель основана на предположении, что базовая функция риска зависит от времени, t, но переменные предиктора не действуют. Это предположение также называется предположением пропорциональных рисков, которое утверждает, что отношение рисков не изменяется с течением времени для любого человека.

Коэффициент риска представляет относительный риск мгновенного отказа для людей или предметов, имеющих прогностическое значение переменной Xi, по сравнению с теми, которые имеют базовые значения. Например, если прогностической переменной является статус курения, где некурящий является базовой категорией, отношение рисков показывает относительную частоту мгновенных отказов курильщиков по сравнению с базовой категорией, то есть некурящих. Для базовой линии относительно X * и переменной предиктора Xi отношение рисков равно

HR (Xi) = h (Xi, t) h (X *, t) =exp[∑j=1p (xij − xj *) bj].

Например, если базовая линия является средними значениями переменных предиктора (mean(X)), то коэффициент опасности становится

HR (Xi) = h (Xi, t) h (X, t) =exp[∑j=1p (xij − x bj) bj].

Коэффициенты опасности связаны с показателями выживаемости, так что коэффициент выживаемости в момент времени t для человека с пояснительным переменным значением Xi равен

SXi (t) = S0 (t) HR (Xi),

где S0 (t) - функция выжившего с функцией базовой скорости риска h0 (t), а HR (Xi) - отношение риска переменной предсказателя Xi к базовому значению.

Расширение модели пропорциональных рисков Кокса

При наличии переменных, которые не удовлетворяют предположению о пропорциональных опасностях (PH), можно рассмотреть возможность использования двух расширений модели пропорциональных опасностей Кокса: стратифицированной модели Кокса и модели Кокса с зависящими от времени переменными.

Если переменные, которые не удовлетворяют предположению PH, являются категоризируемыми, используйте стратифицированную модель Кокса:

hs (Xi, t) = h0s (t) exp[∑j=1pxijbj],

где нижний индекс s указывает слой sth. Стратифицированная модель Кокса имеет различную функцию базовой степени опасности для каждого слоя, но имеет общие коэффициенты. Следовательно, он имеет одинаковое отношение рисков во всех слоях, если значения переменных предиктора одинаковы. Можно включить переменные стратификации в coxphfit с помощью пары имя-значение 'Strata'.

Если переменные, которые не удовлетворяют предположению PH, являются переменными, зависящими от времени, используйте модель Кокса с переменными, зависящими от времени:

h (Xi, t) = h0 (t) exp[∑j=1p1xijbj+∑k=1p2xik (t) ck],

где xij - элемент не зависящего от времени предиктора, а xik (t) - элемент зависящего от времени предиктора. Пример включения зависящих от времени переменных вcoxphfit, см. Модель пропорциональных рисков Кокса с зависимыми от времени ковариатами.

Функция частичного правдоподобия

Точечная оценка эффекта каждой объясняющей переменной, то есть оценочное отношение рисков для эффекта каждой объясняющей переменной, является exp (b), учитывая, что все другие переменные поддерживаются постоянными, где b - оценка коэффициента для этой переменной. Оценки коэффициентов находят путем максимизации функции частичного правдоподобия модели. Функция частичного правдоподобия для модели регрессии пропорциональных рисков основана на наблюдаемом порядке событий. Это произведение частичных вероятностей отказов, оцениваемых для каждого времени отказа. Если есть n отказов в n различных времен отказа, t1<t2<⋯<tn, то частичная вероятность равна

L = HR (X1) ∑j=1nHR (Xj) × HR (X2) ∑j=2nHR (Xj) ×⋅⋅⋅×HR (Xn) HR (Xn) =∏i=1nHR (Xi) ∑j=inHR (Xj).

Можно переписать частичное правдоподобие с помощью набора рисков Ri:

L=∏i=1nHR (Xi) ∑j∈RiHR (Xj),

где Ri представляет набор индексов субъектов, которые изучаются, но не испытывают событие до i-го времени отказа.

Можно использовать тест отношения правдоподобия для оценки значимости добавления термина или терминов в модель. Рассмотрим две модели, где первая модель имеет p прогнозирующих переменных, а вторая модель имеет p + r прогнозирующих переменных. Затем, сравнивая две модели, -2 * (L1/L2) имеет распределение хи-квадрат с r степенями свободы (количество тестируемых членов ).

Функция частичного правдоподобия для связанных событий

Когда вы связали события, coxphfit аппроксимирует частичную вероятность модели методом Бреслоу (по умолчанию) или методом Эфрона, вместо вычисления точной частичной вероятности. Вычисление точного частичного правдоподобия требует большого количества вычислений, которое включает в себя полную перестановку наборов рисков для связанных времен событий.

Простейшим методом аппроксимации является метод Бреслоу. Этот метод использует один и тот же знаменатель для каждого связанного множества.

L=∏i=1d∏j∈DiHR (Xj) ∑k∈RiHR (Xk),

где d - количество различных времен события, а Di - набор индексов всех субъектов, время события которых равно i-му времени события.

Метод Эфрона более точен, чем метод Бреслоу, но прост. Этот метод регулирует знаменатель связанных событий следующим образом:

L=∏i=1d∏j∈DiHR (Xj) ∑k∈RiHR (Xk) −j−1di∑k∈DiHR (Xk),

где di - число индексов в Di.

Например, предположим, что первые два события связаны, то есть t1 = t2 и t2<t3<⋯<tn. В методе Бреслоу знаменатели первых двух слагаемых одинаковы:

L=HR (X1) ∑j=1nHR (Xj) ×HR (X2) ∑j=1nHR (Xj) ×HR (X3) ∑j=3nHR (Xj) ×HR (X4) ∑j=4nHR (Xj) × HR ⋅⋅⋅×HR (Xn) (Xn).

Метод Эфрона корректирует знаменатель второго члена:

L=HR (X1) ∑j=1nHR (Xj) ×HR (X2) 0,5 HR (X1) +0.5HR (X2) + ∑j=3nHR (Xj) ×HR (X3) ∑j=3nHR (Xj) ×HR (X4) ∑j=4nHR (Xj) × ⋅⋅⋅×HR (Xn, tn) HR (Xn, tn).

Метод аппроксимации можно задать с помощью пары имя-значение 'Ties' в coxphfit.

Частота или вес наблюдений

Модель пропорциональных рисков Кокса может включать частоту или вес наблюдений. Пусть wi будет весом i-го наблюдения. Затем частичные вероятности модели Кокса с весами становятся следующими:

  • Частичная вероятность с весами

    L=∏i=1nHRw (Xi) ∑j∈RiwjHR (Xj),

    где

    HRw (Xi) =exp[∑j=1pwjxijbj].

  • Частичная вероятность с весами и методом Бреслоу

    L=∏i=1d∏j∈DiHRw (Xj) [∑k∈RiwkHR (Xk)] 1di∑j∈Diwj

  • Частичная вероятность с весами и методом Эфрона

    L=∏i=1d∏j∈DiHRw (Xj) [∑k∈RiwkHR (Xk) −j−1di∑k∈DiwkHR (Xk)] 1di∑j∈Diwj

Можно указать частоту или вес наблюдений с помощью пары «имя-значение». 'Frequency' в coxphfit.

Ссылки

[1] Кокс, D. R. и Д. Оукс. Анализ данных о выживании. Лондон: Chapman & Hall, 1984.

[2] Беззаконие, J.F. Статистические модели и методы для данных о сроке службы. Хобокен, Нью-Джерси: Wiley-Interscience, 2002.

[3] Клейнбаум, Д. Г. и М. Кляйн. Анализ выживания. Статистика биологии и здравоохранения. 2-е издание. Спрингер, 2005.

[4] Кляйн, Дж. П. и М. Л. Моешбергер. Анализ выживания. Статистика биологии и здравоохранения. 2-е издание. Спрингер, 2003.

См. также

| |

Связанные примеры

Подробнее