Модель пропорциональных рисков Кокса

Введение

Регрессия пропорциональных рисков Кокса является семипараметрическим методом для корректировки оценок выживаемости, чтобы количественно определить эффект переменных. Метод представляет эффекты объяснительных переменных как умножитель общей функции базовой опасности, h 0 (t). Функция опасности является непараметрической частью функции регрессии пропорциональных рисков Кокса, в то время как влияние переменных предиктора является логлинейной регрессией. Для опорной линии относительно 0 эта модель соответствует

$h (X_{i}, t) = h_{0} (t) \exp [\sum_{j = 1}^{p} x_{i j} b_{j}],$

где $X_{i} = (x_{i 1}, x_{i 2}, \dots, x_{i p})$ переменная предсказателя для предмета <reservedrangesplaceholder9> th, h (X i, t) _темп опасности во время t для <reservedrangesplaceholder3> <reservedrangesplaceholder2>, и <reservedrangesplaceholder1> 0 (<reservedrangesplaceholder0>) является базовой функцией темпа опасности.

Коэффициент опасности

Модель пропорциональных рисков Кокса связывает скорость опасности для индивидуумов или элементов по значению X i с частотой опасности для индивидуумов или элементов по базовому значению. Он дает оценку коэффициента опасности:

$H R (X_{i}) = \frac{h (X_{i}, t)}{h_{0} (t)} = \exp [\sum_{j = 1}^{p} x_{i j} b_{j}] .$

Модель основана на предположении, что базовая функция опасности зависит от времени, t, но предиктор не переменных. Это предположение также называется предположением пропорциональных опасностей, которое утверждает, что отношение опасностей не изменяется с течением времени ни для каких индивидуумов.

Коэффициент опасности представляет относительный риск мгновенного отказа для людей или элементов, имеющих прогнозирующее значение X i по сравнению с теми, которые имеют базовые значения. Например, если прогнозирующей переменной является статус курения, где некурение является базовой категорией, коэффициент опасности показывает относительную мгновенную частоту отказов курильщиков по сравнению с базовой категорией, то есть некурящих. Для опорной линии относительно X^* и предиктор значения переменных X i, коэффициент опасности

$H R (X_{i}) = \frac{h (X_{i}, t)}{h (X^{*}, t)} = \exp [\sum_{j = 1}^{p} (x_{i j} - x_{j}^{*}) b_{j}] .$

Для примера, если базовая линия является средними значениями переменных предиктора (mean(X)), затем коэффициент опасности становится

$H R (X_{i}) = \frac{h (X_{i}, t)}{h (\bar{X}, t)} = \exp [\sum_{j = 1}^{p} (x_{i j} - {\bar{x}}_{j}) b_{j}] .$

Показатели опасности связаны с выживаемостью, таким образом, что выживаемость в то время t для человека с объяснительным переменным значением X i,

$S_{X_{i}} (t) = S_{0} {(t)}^{H R (X_{i})},$

где <reservedrangesplaceholder8> 0 (<reservedrangesplaceholder7>) является функцией оставшегося в живых с базовым <reservedrangesplaceholder6> 0 функции темпа опасности (<reservedrangesplaceholder5>), и HR (X i) отношение опасности значения переменных <reservedrangesplaceholder1> <reservedrangesplaceholder0> предсказателя относительно базового значения.

Расширение модели пропорциональных рисков Кокса

Когда у вас есть переменные, которые не удовлетворяют предположению пропорциональных опасностей (PH), можно рассмотреть использование двух расширений модели пропорциональных опасностей Кокса: стратифицированной модели Кокса и модели Кокса с зависящими от времени переменными.

Если переменные, которые не удовлетворяют предположению PH, классифицируются, используйте стратифицированную модель Кокса:

$h_{s} (X_{i}, t) = h_{0 s} (t) \exp [\sum_{j = 1}^{p} x_{i j} b_{j}],$

где s индекса указывает на s-й пласт. Стратифицированная модель Кокса имеет разную функцию базовой скорости опасности для каждого слоя, но разделяет коэффициенты. Поэтому он имеет одинаковое отношение опасности во всех слоях, если значения переменных предиктора одинаковы. Можно включать переменные стратификации вcoxphfit при помощи пары "имя-значение" 'Strata'.

Если переменные, которые не удовлетворяют допущению PH, являются зависящими от времени переменными, используйте модель Кокса с зависящими от времени переменными:

$h (X_{i}, t) = h_{0} (t) \exp [\sum_{j = 1}^{p_{1}} x_{i j} b_{j} + \sum_{k = 1}^{p_{2}} x_{i k} (t) c_{k}],$

где x _ij является элементом массива независимым от времени предиктором, а _x ik (t) является элементом массива зависящим от времени предиктором. Для примера того, как включить зависящие от времени переменные вcoxphfit, см. Модель пропорциональных опасностей Кокса с зависящими от времени ковариатами.

Функция частичного правдоподобия

Точечная оценка эффекта каждой объясняющей переменной, то есть предполагаемый коэффициент опасности для эффекта каждой объясняющей переменной является exp (b), учитывая, что все другие переменные остаются постоянными, где b - оценка коэффициента для этой переменной. Оценки коэффициентов найдены путем максимизации частичной функции правдоподобия модели. Частичная функция правдоподобия для модели регрессии пропорциональных рисков основана на наблюдаемом порядке событий. Это является продуктом частичных вероятностей отказов, рассчитанных для каждого времени отказа. Если имеют место < reservedrangesplaceholder1 > отказов при n разных временах отказа, $t_{1} < t_{2} < \dots < t_{n}$ , тогда частичная вероятность

$L = \frac{H R (X_{1})}{\sum_{j = 1}^{n} H R (X_{j})} \times \frac{H R (X_{2})}{\sum_{j = 2}^{n} H R (X_{j})} \times \cdot \cdot \cdot \times \frac{H R (X_{n})}{H R (X_{n})} = \prod_{i = 1}^{n} \frac{H R (X_{i})}{\sum_{j = i}^{n} H R (X_{j})} .$

Вы можете переписать частичную вероятность с помощью набора рисков R i :

$L = \prod_{i = 1}^{n} \frac{H R (X_{i})}{\sum_{j \in R_{i}} H R (X_{j})},$

где R i представляет индексу набор субъектов, которые находятся в исследовании, но не испытывают событие до i-го времени отказа.

Можно использовать тест коэффициента правдоподобия, чтобы оценить значимость добавления термина или членов в модели. Рассмотрим две модели, где первая модель имеет p прогнозирующих переменных, а вторая модель - p + r прогнозирующих переменных. Затем, сравнивая две модели, -2 * ₍L ₁/ L 2) имеет распределение хи-квадрат с r степенями свободы (количество проверяемых членов).

Функция частичного правдоподобия для связанных событий

Когда вы связали события, coxphfit аппроксимирует частичную вероятность модели методом Бреслоу (по умолчанию) или Эфроном, вместо вычисления точной частичной вероятности. Вычисление точной частичной вероятности требует большого объема расчетов, что включает целое сочетание наборов рисков для связанного времени события.

Самый простой метод приближения является методом Бреслоу. Этот метод использует тот же знаменатель для каждого связанного набора.

$L = \prod_{i = 1}^{d} \prod_{j \in D_{i}} \frac{H R (X_{j})}{\sum_{k \in R_{i}} H R (X_{k})},$

где d - количество различных моментов времени, и D i - индекс набор всех субъектов, чье время события равно i времени события.

Метод Ефрона более точен, чем метод Бреслоу, но прост. Этот метод корректирует знаменатель связанных событий следующим образом:

$L = \prod_{i = 1}^{d} \prod_{j \in D_{i}} \frac{H R (X_{j})}{\sum_{k \in R_{i}} H R (X_{k}) - \frac{j - 1}{d_{i}} \sum_{k \in D_{i}} H R (X_{k})},$

где d i - количество индексов в _D i.

Например, предположим, что первые два события связаны, то есть t 1 = _t 2 и $t_{2} < t_{3} < \dots < t_{n}$ . В методе Бреслова знаменатели первых двух членов одинаковы:

$L = \frac{H R (X_{1})}{\sum_{j = 1}^{n} H R (X_{j})} \times \frac{H R (X_{2})}{\sum_{j = 1}^{n} H R (X_{j})} \times \frac{H R (X_{3})}{\sum_{j = 3}^{n} H R (X_{j})} \times \frac{H R (X_{4})}{\sum_{j = 4}^{n} H R (X_{j})} \times \cdot \cdot \cdot \times \frac{H R (X_{n})}{H R (X_{n})} .$

Метод Эфрона настраивает знаменатель второго члена:

$L = \frac{H R (X_{1})}{\sum_{j = 1}^{n} H R (X_{j})} \times \frac{H R (X_{2})}{0.5 H R (X_{1}) + 0.5 H R (X_{2}) + \sum_{j = 3}^{n} H R (X_{j})} \times \frac{H R (X_{3})}{\sum_{j = 3}^{n} H R (X_{j})} \times \frac{H R (X_{4})}{\sum_{j = 4}^{n} H R (X_{j})} \times \cdot \cdot \cdot \times \frac{H R (X_{n}, t_{n})}{H R (X_{n}, t_{n})} .$

Можно задать метод приближения, используя пару "имя-значение" 'Ties' в coxphfit.

Частота или веса наблюдений

Модель пропорциональных рисков Кокса может включать частоту или веса наблюдений. Пусть w i быть весом i-го наблюдения. Затем частичные вероятности модели Кокса с весами становятся следующими:

Частичная вероятность с весами

$L = \prod_{i = 1}^{n} \frac{H R_{w} (X_{i})}{\sum_{j \in R_{i}} w_{j} H R (X_{j})},$
где

$H R_{w} (X_{i}) = \exp [\sum_{j = 1}^{p} w_{j} x_{i j} b_{j}] .$
Частичная вероятность с весами и методом Бреслоу

$L = \prod_{i = 1}^{d} \prod_{j \in D_{i}} \frac{H R_{w} (X_{j})}{{[\sum_{k \in R_{i}} w_{k} H R (X_{k})]}^{\frac{1}{d_{i}} \sum_{j \in D_{i}} w_{j}}}$
Частичная вероятность с весами и метод Эфрона

$L = \prod_{i = 1}^{d} \prod_{j \in D_{i}} \frac{H R_{w} (X_{j})}{{[\sum_{k \in R_{i}} w_{k} H R (X_{k}) - \frac{j - 1}{d_{i}} \sum_{k \in D_{i}} w_{k} H R (X_{k})]}^{\frac{1}{d_{i}} \sum_{j \in D_{i}} w_{j}}}$

Можно задать частоту или веса наблюдений с помощью пары "имя-значение" 'Frequency' в coxphfit.

Ссылки

[1] Кокс, Д. Р. и Д. Окс. Анализ данных о выживании. Лондон: Chapman & Hall, 1984.

[2] Lawless, J. F. Статистические модели и методы для пожизненных данных. Hoboken, NJ: Wiley-Interscience, 2002.

[3] Клейнбаум, Д. Г., и М. Клейн. Анализ выживания. Статистика по биологии и здоровью. 2-е издание. Спрингер, 2005.

[4] Klein, J. P., and M. L. Moeschberger. Анализ выживания. Статистика по биологии и здоровью. 2-е издание. Спрингер, 2003.

См. также

coxphfit | ecdf | ksdensity

Документация