coxphfit

Cox пропорциональная регрессия опасностей

Описание

пример

b = coxphfit(X,T) возвращает p-by-1 вектор, b, из коэффициента оценивает для Cox пропорциональную регрессию опасностей наблюдаемых ответов T на предикторах X, где T или n-by-1 вектор или n-by-2 матрица и X n-by-p матрица.

Модель не включает постоянный термин и X не может содержать столбец 1 с.

пример

b = coxphfit(X,T,Name,Value) возвращает вектор из содействующих оценок, с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы.

пример

[b,logl,H,stats] = coxphfit(___) также возвращает логарифмическую правдоподобность, logl, структура, stats, это содержит дополнительную статистику, и матрицу 2D столбца, H, это содержит T значения в первом столбце и предполагаемой базовой совокупной опасности, во втором столбце. Можно комбинировать с любым синтаксом из перечисленных выше.

Примеры

свернуть все

Загрузите выборочные данные.

load('lightbulb.mat');

Первый столбец данных о лампочке имеет время жизни (в часах) двух различных типов ламп. Второй столбец имеет бинарную переменную, указывающую, флуоресцентна ли лампа или накалена. 0 указывает, что лампа является лампой накаливания, и 1 указывает, что это флуоресцентно. Третий столбец содержит информацию о цензуре, где 0 указывает, что лампа наблюдалась, пока отказ, и 1 не указывает, что лампа была подвергнута цензуре.

Соответствуйте Cox пропорциональная модель опасностей в течение времени жизни лампочек, также объясняя цензурирование. Переменный предиктор является типом лампы.

b = coxphfit(lightbulb(:,2),lightbulb(:,1), ...
'Censoring',lightbulb(:,3))
b = 4.7262

Оценка отношения опасности eb = 112.8646. Это означает, что опасность для ламп накаливания является 112.86 раз опасностью для флуоресцентных ламп.

Загрузите выборочные данные.

load('lightbulb.mat');

Первый столбец данных имеет время жизни (в часах) двух типов ламп. Второй столбец имеет бинарную переменную, указывающую, флуоресцентна ли лампа или накалена. 1 указывает, что лампа флуоресцентна, и 0 указывает, что это - лампа накаливания. Третий столбец содержит информацию о цензуре, где 0 указывает, что лампа наблюдается, пока отказ, и 1 не указывает, что элемент (лампа) подвергается цензуре.

Соответствуйте Cox пропорциональная модель опасностей, также объясняя цензурирование. Переменный предиктор является типом лампы.

b = coxphfit(lightbulb(:,2),lightbulb(:,1),...
'Censoring',lightbulb(:,3))
b = 4.7262

Отобразите параметры управления по умолчанию для алгоритма coxphfit использование, чтобы оценить коэффициенты.

statset('coxphfit')
ans = struct with fields:
          Display: 'off'
      MaxFunEvals: 200
          MaxIter: 100
           TolBnd: 1.0000e-06
           TolFun: 1.0000e-08
       TolTypeFun: []
             TolX: 1.0000e-08
         TolTypeX: []
          GradObj: []
         Jacobian: []
        DerivStep: []
      FunValCheck: []
           Robust: []
     RobustWgtFun: []
           WgtFun: []
             Tune: []
      UseParallel: []
    UseSubstreams: []
          Streams: {}
        OutputFcn: []

Сохраните опции под другим именем и изменитесь, как результаты будут отображены и максимальное количество итераций, Display и MaxIter.

coxphopt = statset('coxphfit');
coxphopt.Display = 'final';
coxphopt.MaxIter = 50;

Запустите coxphfit с новыми параметрами алгоритма.

b = coxphfit(lightbulb(:,2),lightbulb(:,1),...
'Censoring',lightbulb(:,3),'Options',coxphopt)
Successful convergence: Norm of gradient less than OPTIONS.TolFun
b = 4.7262

coxphfit отображает отчет относительно итоговой итерации. Изменение максимального количества итераций не влияло на содействующую оценку.

Сгенерируйте данные Weibull в зависимости от предиктора X.

rng('default') % for reproducibility
X = 4*rand(100,1);
A = 50*exp(-0.5*X); 
B = 2;
y = wblrnd(A,B);

Значения отклика сгенерированы от распределения Weibull параметром формы в зависимости от переменного предиктора X и масштабный коэффициент 2.

Соответствуйте Cox пропорциональная модель опасностей.

[b,logL,H,stats] = coxphfit(X,y);
[b logL]
ans = 1×2

    0.9409 -331.1479

Содействующая оценка 0.9409, и логарифмическое значение вероятности –331.1479.

Запросите статистику модели.

stats
stats = struct with fields:
       covb: 0.0158
       beta: 0.9409
         se: 0.1256
          z: 7.4889
          p: 6.9462e-14
      csres: [100x1 double]
     devres: [100x1 double]
    martres: [100x1 double]
     schres: [100x1 double]
    sschres: [100x1 double]
     scores: [100x1 double]
    sscores: [100x1 double]

Ковариационная матрица содействующих оценок, covb, содержит только одно значение, которое равно отклонению содействующей оценки в этом примере. Содействующая оценка, beta, совпадает с b и равно 0,9409. Стандартная погрешность содействующей оценки, se, 0.1256, который является квадратным корнем из отклонения 0.0158. z- статистическая величина, z, beta/se = 0.9409/0.1256 = 7.4880. P-значение, p, указывает что эффект X является значительным.

Постройте оценку Cox базовой функции оставшегося в живых вместе с известной функцией Weibull.

stairs(H(:,1),exp(-H(:,2)),'LineWidth',2)
xx = linspace(0,100);
line(xx,1-wblcdf(xx,50*exp(-0.5*mean(X)),B),'color','r','LineWidth',2)
xlim([0,50])
legend('Estimated Survivor Function','Weibull Survivor Function')

Подобранная модель дает близкую оценку функции оставшегося в живых фактического распределения.

Входные параметры

свернуть все

Наблюдения относительно переменных предикторов в виде n-by-p матрица предикторов p для каждого из наблюдений n.

Модель не включает постоянный термин, таким образом X не может содержать столбец 1 с.

Если XT, или значение 'Frequency' или 'Strata' содержите NaN значения, затем coxphfit удаляет строки с NaN значения из всех данных, подбирая модель Cox.

Типы данных: double

Время к данным о событиях в виде n-by-1 вектор или матрица 2D столбца.

  • Когда T является n-by-1 вектор, он представляет время события подвергнутого цензуре правом времени к данным о событиях.

  • Когда T является n-by-2 матрица, каждая строка представляет интервал риска (запустите, остановитесь] в формате процесса подсчета для зависящих от времени ковариантов. Первый столбец является временем начала, и второй столбец является временем остановки. Для примера смотрите Cox Пропорциональная Модель Опасностей с Зависящими от времени Ковариантами.

Если XT, или значение 'Frequency' или 'Strata' содержите NaN значения, затем coxphfit удаляет строки с NaN значения из всех данных, подбирая модель Cox.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Baseline',0,'Censoring',censoreddata,'Frequency',freq задает тот coxphfit вычисляет базовый показатель риска относительно 0, рассматривая информацию о цензурировании в векторном censoreddata, и частота наблюдений относительно T и X данный в векторном freq.

Содействующие начальные значения в виде разделенного от запятой значения, состоящего из 'B0' и числовой вектор.

Типы данных: double

X значения, в которых можно вычислить базовую опасность в виде разделенной запятой пары, состоящей из 'Baseline' и скалярное значение.

Значением по умолчанию является mean(X), так показатель риска в X h(t)*exp((X-mean(X))*b). Введите 0 вычислить базовую линию относительно 0, таким образом, показатель риска в X h(t)*exp(X*b). Изменение базовой линии не влияет на содействующие оценки, но изменения отношения опасности.

Пример: 'Baseline',0

Типы данных: double

Индикатор для цензурирования в виде разделенной запятой пары, состоящей из 'Censoring' и булев массив одного размера с T. Используйте 1 для наблюдений, которые являются правильные подвергнутый цензуре и 0 для наблюдений, которые полностью наблюдаются. Значением по умолчанию являются все наблюдения, полностью наблюдаются. Для примера смотрите Cox Пропорциональная Модель Опасностей для Подвергнутых цензуре Данных.

Пример: 'Censoring',cens

Типы данных: логический

Частота или веса наблюдений в виде разделенной запятой пары, состоящей из 'Frequency' и массив, который одного размера с T содержа неотрицательные скалярные значения. Массив может содержать целочисленные значения, соответствующие частотам наблюдений или неотрицательных значений, соответствующих весам наблюдения.

Если XT, или значение 'Frequency' или 'Strata' содержите NaN значения, затем coxphfit удаляет строки с NaN значения из всех данных, подбирая модель Cox.

Значение по умолчанию 1 на строку X и T.

Пример: 'Frequency',w

Типы данных: double

Переменные стратификации в виде разделенной запятой пары, состоящей из матрицы действительных значений. Матрица должна иметь одинаковое число строк как T, с каждой строкой, соответствующей наблюдению.

Если XT, или значение 'Frequency' или 'Strata' содержите NaN значения, затем coxphfit удаляет строки с NaN значения из всех данных, подбирая модель Cox.

Значение по умолчанию, [], не переменная стратификации.

Пример: 'Strata',Gender

Типы данных: single | double

Метод, чтобы обработать связанные времена отказа в виде разделенной запятой пары, состоящей из 'Ties' и любой 'breslow' (Метод Бреслоу) или 'efron' (Метод Эфрона).

Пример: 'Ties','efron'

Параметры управления алгоритмом для итеративного алгоритма раньше оценивали bВ виде разделенной запятой пары, состоящей из 'Options' и структура. Вызов statset создает этот аргумент. Для названий параметра и значений по умолчанию, введите statset('coxphfit'). Можно установить опции под новым именем и использованием это в аргументе пары "имя-значение".

Пример: 'Options',statset('coxphfit')

Выходные аргументы

свернуть все

Коэффициент оценивает для Cox пропорциональную регрессию опасностей, возвращенную как p-by-1 вектор.

Логарифмическая правдоподобность подобранной модели, возвращенной как скаляр.

Можно использовать логарифмические значения вероятности, чтобы сравнить различные модели и оценить значение эффектов членов в модели.

Предполагаемый базовый совокупный показатель риска оценен в T значения, возвращенные как одно из следующих.

  • Если модель не стратифицирована, то H матрица 2D столбца. Первый столбец матрицы содержит T значения и второй столбец содержат совокупные оценки показателя риска.

  • Если модель расслоена, то H (2+k) матрица столбца, где последние столбцы k соответствуют переменным стратификации с помощью Strata аргумент пары "имя-значение".

Содействующая статистика, возвращенная как структура, которая содержит следующие поля.

betaСодействующие оценки (то же самое как b)
seСтандартные погрешности содействующих оценок, b
zz- для b (то есть, b разделенный на стандартную погрешность)
pp- для b
covb

Предполагаемая ковариационная матрица для b

csres

Остаточные значения поводка Cox

devresОстаточные значения отклонения
martresОстаточные значения мартингала
schresОстаточные значения Шенфельда
sschresМасштабированные остаточные значения Шенфельда
scoresВыиграйте остаточные значения
sscoresМасштабированные остаточные значения счета

coxphfit возвращает Поводок Cox, мартингал и остаточные значения отклонения как вектор-столбец с одной строкой на наблюдение. Это возвращает Шенфельд, масштабированного Шенфельда, счет, и масштабировало остаточные значения счета как матрицы одного размера с Кс. Шенфельдом и масштабировалось, остаточными значениями Шенфельда подвергнутых цензуре данных является NaNs.

Больше о

свернуть все

Cox пропорциональная регрессия опасностей

Cox пропорциональная регрессия опасностей является полупараметрическим методом для корректировки оценок выживаемости, чтобы удалить эффект соединения переменных и определить количество эффекта переменных предикторов. Метод представляет эффекты объяснительных и соединяющих переменных как множитель общей базовой функции опасности, h 0 (t).

Для базовой линии относительно 0, эта модель соответствует

h(Xi,t)=h0(t)exp[j=1pxijbj],

где Xi=(xi1,xi2,,xip) переменный предиктор для i th предмет, h (X i, t) является показателем риска во время t для X i, и h 0 (t) является базовой функцией показателя риска. Базовая функция опасности является непараметрической частью Cox пропорциональная функция регрессии опасностей, тогда как удар переменных предикторов является логлинейной регрессией. Предположение - то, что базовая функция опасности зависит вовремя, t, но переменные предикторы не зависят вовремя. Смотрите Cox Пропорциональная Модель Опасностей для получения дополнительной информации включая расширения для стратификации и зависящих от времени переменных, связанных событий и весов наблюдения.

Ссылки

[1] Cox, D.R., и Д. Оукс. Анализ данных о выживании. Лондон: Chapman & Hall, 1984.

[2] Беззаконный, J. F. Статистические модели и методы для пожизненных данных. Хобокен, NJ: Wiley-межнаука, 2002.

[3] Kleinbaum, D. G. и М. Клейн. Анализ выживания. Статистика для Биологии и здоровья. 2-й выпуск. Спрингер, 2005.

Расширенные возможности

Представлено до R2006a