Что такое анализ выживания?

Введение

Анализ выживания является анализом времени к событию, то есть, когда результатом интереса является время, пока событие не имеет место. Примерами времени к событиям является время до заражения, повторения болезни или восстановления в медицинских науках, длительности безработицы в экономике, время до отказа части машины или время жизни лампочек в разработке, и так далее. Анализ выживания является частью исследований надежности в разработке. В этом случае это обычно используется, чтобы изучить время жизни промышленных компонентов. В анализах надежности времена выживания обычно называются временами отказа, как переменная интереса - то, сколько времени компонент функционирует правильно, прежде чем это перестанет работать.

Анализ выживания состоит из параметрических, полупараметрических, и непараметрических методов. Можно использовать их, чтобы оценить обычно используемые меры в исследованиях выживания, оставшемся в живых и функциях опасности, сравнить их для различных групп и оценить отношение переменных прогноза ко времени выживания. Некоторые статистические распределения вероятностей описывают времена выживания хорошо. Обычно используемые дистрибутивы экспоненциальны, Weibull, логарифмически нормальны, Берр и дистрибутивы Бирнбаума-Сондерса. Функции Statistics and Machine Learning Toolbox™ ecdf и ksdensity вычисляют эмпирическое и оценки плотности ядра cdf, совокупной опасности и функций оставшегося в живых. coxphfit соответствует Cox пропорциональная модель опасностей к данным.

Цензурирование

Одна важная концепция в анализе выживания подвергает цензуре. Времена выживания некоторых людей не могут полностью наблюдаться из-за различных причин. В науках о жизни происходит эта сила, когда исследование выживания (например, клиническое испытание) остановки перед целыми временами выживания всех людей могут наблюдаться, или человек выпадает из исследования, или для долгосрочных исследований, когда пациент потерян, чтобы продолжить. В промышленном контексте не все компоненты могут перестать работать перед концом исследования надежности. В таких случаях человек выживает вне времени исследования, и точное время выживания неизвестно. Это называется правильным цензурированием.

Во время исследования выживания или человек, как наблюдают, приводит к сбою во время T, или наблюдение относительно того человека прекращает во время c. Затем наблюдение является min (T, c), и переменная I c индикатора показывает, подвергается ли человек цензуре или нет. Вычисления для опасности и функций оставшегося в живых должны быть настроены, чтобы составлять цензурирование. Statistics and Machine Learning Toolbox функционирует, такие как ecdf, ksdensity, coxphfit, счет mle на цензурирование.

Данные

Данные о выживании обычно состоят из времени, пока мероприятие не происходит и информация о цензурировании для каждого человека или компонента. Следующая таблица показывает фиктивное время безработицы людей в 6-месячном исследовании. Два человека правы подвергнутый цензуре (обозначенный значением цензурирования 1). Один человек был все еще безработным после 24-й недели, когда законченное исследование. Контакт с другим подвергнутым цензуре человеком был потерян в конце 21-й недели.

Время безработицы (недели)Цензурирование
140
230
70
211
190
160
241
80

Данные о выживании могут также включать количество отказов в определенное время (число раз, конкретное время выживания или отказа наблюдалось). Следующая таблица показывает моделируемое время до спады светодиодов до 70% его полного уровня светоотдачи, в часах, в ускоренном жизненном тесте.

Время отказа (часы)Частота
86006
1530019
2200011
2860020
3530017
4200014
487008
554002
621000
688002

Данные могут также иметь информацию о переменных прогноза, чтобы использовать в полупараметрических подобных регрессии методах, таких как Cox пропорциональную регрессию опасностей.

Время до восстановления (недели)ЦензурированиеПолСистолическое кровяное давлениеДиастолическое кровяное давление
121Штекер12493
200Розетка10977
70Розетка12583
130Штекер 11775
91Штекер12280
150Розетка12170
171Штекер13088
80Розетка11582
140Штекер11886

Функция оставшегося в живых

Функция оставшегося в живых является вероятностью выживания как функция времени. Это также вызвано функция выживания. Это дает вероятность, что время выживания человека превышает определенное значение. Поскольку кумулятивная функция распределения, F (t), является вероятностью, что время выживания меньше чем или равно данному моменту времени, функция выживания для непрерывного распределения, S (t), является дополнением кумулятивной функции распределения:

S (t) = 1 – F (t).

Например, для данных, прибывающих из распределения Берра с параметрами 50, 3, и 1, можно вычислить и построить функцию оставшегося в живых.

x = 0:0.1:200;
figure()
plot(x,1-cdf('Burr',x,50,3,1))
xlabel('Failure time');
ylabel('Survival probability');

Функция оставшегося в живых также связана с функцией опасности. Если данные имеют функцию опасности, h (t), то функция оставшегося в живых

S(t)=exp(0th(u)du),

который соответствует

S(t)=exp(H(t)),

где H (t) является совокупной функцией опасности.

Функция опасности

Функция опасности дает мгновенную интенсивность отказов человека, тренируемого на том, что человек, переживший до данного времени. Таким образом,

h(t)=lim Δt0P(tT<t+Δt|Tt)Δt,

где Δt является очень маленьким временным интервалом. Показатель риска, поэтому, иногда называется условной интенсивностью отказов. Функция опасности всегда принимает положительное значение. Однако эти значения не соответствуют вероятностям и могут быть больше, чем 1.

Функция опасности связана с функцией плотности вероятности, f (t), кумулятивная функция распределения, F (t) и функция оставшегося в живых, S (t), можно следующим образом:

h(t)=f(t)S(t)=f(t)1F(t),

который также эквивалентен

h(t)=ddtlnS(t).

Так, если вы знаете форму функции выживания, можно также вывести соответствующую функцию опасности.

Например, для данных, прибывающих из распределения Берра с параметрами 50, 3, и 1, можно вычислить и построить функцию опасности.

x = 0:1:200;
Burrhazard = pdf('Burr',x,50,3,1)./(1-cdf('Burr',x,50,3,1));
figure()
plot(x,Burrhazard)
xlabel('Failure time');
ylabel('Hazard rate');

Существуют различные типы функций опасности. Предыдущие данные показывают ситуацию, когда увеличения показателя риска для ранних периодов времени и затем постепенно уменьшаются. Показатель риска может также монотонно уменьшаться, увеличение, или постоянный в зависимости от времени. Следующие данные показывают примеры различных типов функций опасности для данных, прибывающих из различных дистрибутивов Weibull.

ax1 = subplot(3,1,1);
x1 = 0:0.5:30;
hazard1 = pdf('wbl',x1,3,0.6)./(1-cdf('wbl',x1,3,0.6));
plot(x1,hazard1)

ax2 = subplot(3,1,2);
x2 = 0:0.05:2;
hazard2 = pdf('wbl',x2,0.9,4)./(1-cdf('wbl',x2,0.9,4));
plot(x2,hazard2,'color','r')

ax3 = subplot(3,1,3);
x3 = 0:0.05:5;
hazard3 = pdf('wbl',x3,2.5,1)./(1-cdf('wbl',x3,2.5,1));
plot(x3,hazard3)

set(ax1,'Ylim',[0 0.4]);
legend(ax1,'a=3, b=0.6');
legend(ax2,'a=0.9, b=4','location','northwest');
legend(ax3,'a=2.5, b=1');

В третьем случае распределение Weibull имеет значение параметров формы 1, который соответствует экспоненциальному распределению. Экспоненциальное распределение всегда имеет постоянный показатель риска в зависимости от времени.

Ссылки

[1] Cox, D. R. и Д. Оукс. Анализ данных о выживании. Лондон: Chapman & Hall, 1984.

[2] Беззаконный, J. F. Статистические модели и методы для пожизненных данных. Хобокен, NJ: Wiley-межнаука, 2002.

[3] Kleinbaum, D. G. и М. Клейн. Анализ выживания. Статистика для Биологии и здоровья. 2-й выпуск. Спрингер, 2005.

Смотрите также

| |

Связанные примеры

Больше о

Для просмотра документации необходимо авторизоваться на сайте