mle

Оценки наибольшего правдоподобия

Описание

phat = mle(data) возвращает оценки наибольшего правдоподобия (MLEs) для параметров нормального распределения, с помощью выборочных данных data.

пример

phat = mle(data,Name,Value) задает опции с помощью одних или нескольких аргументов name-value.

Например, можно задать тип распределения при помощи одних из этих аргументов name-value: Distribution, pdf, logpdf, или nloglf.

  • Чтобы вычислить MLEs для встроенного распределения, задайте тип распределения при помощи Distribution. Например, 'Distribution'\beta задает, чтобы вычислить MLEs для бета распределения.

  • Чтобы вычислить MLEs для пользовательского дистрибутива, задайте распределение при помощи pdf, logpdf, или nloglf, и задайте начальные значения параметров при помощи Start.

пример

[phat,pci] = mle(___) также возвращает доверительные интервалы для параметров с помощью любой из комбинаций входных аргументов в предыдущих синтаксисах.

Примеры

свернуть все

Найдите MLEs для встроенного распределения, что вы задаете использование Distribution аргумент значения имени.

Загрузите выборочные данные.

load carbig

Переменная MPG содержит мили на галлон для различных моделей автомобилей.

Чертите гистограмму MPG данные.

 histogram(MPG)

Figure contains an axes object. The axes object contains an object of type histogram.

Распределение несколько правильно скошенный. Симметричное распределение, такое как нормальное распределение, не может быть подходящим вариантом.

Оцените параметры распределения Типа XII Шума для MPG данные.

phat = mle(MPG,'Distribution','burr')
phat = 1×3

   34.6447    3.7898    3.5722

MLE для масштабного коэффициента α 34.6447. Оценки для двух параметров формы c и k из Шума распределение Типа XII 3.7898 и 3.5722, соответственно.

Сгенерируйте 100 случайных наблюдений от биномиального распределения с количеством испытаний n = 20 и вероятность успеха p = 0.75.

rng('default') % For reproducibility
data = binornd(20,0.75,100,1);

Оцените вероятность успеха и 99%-х пределов достоверности с помощью симулированных выборочных данных. Необходимо задать количество испытаний (NTrials) для биномиального распределения.

[phat,pci] = mle(data,'Distribution','binomial','NTrials',20, ...
    'Alpha',.01)
phat = 0.7615
pci = 2×1

    0.7361
    0.7856

Оценка вероятности успеха 0.7615, и нижние и верхние пределы 99%-го доверительного интервала 0.7361 и 0.7856, соответственно. Этот интервал покрывает истинное значение, используемое, чтобы симулировать данные.

Сгенерируйте выборочные данные размера 1000 от нецентрального распределения хи-квадрат со степенями свободы 8 и параметр нецентрированности 3.

rng default % for reproducibility
x = ncx2rnd(8,3,1000,1);

Оцените параметры нецентрального распределения хи-квадрат от выборочных данных. Distribution аргумент значения имени не поддерживает нецентральное распределение хи-квадрат. Поэтому необходимо задать пользовательский нецентральный хи-квадрат PDF с помощью pdf аргумент значения имени и ncx2pdf функция. Необходимо также задать начальные значения параметров (Start аргумент значения имени) для пользовательского дистрибутива.

[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,d),'Start',[1,1])
phat = 1×2

    8.1052    2.6693

pci = 2×2

    7.1120    1.6025
    9.0983    3.7362

Оценка для степеней свободы 8.1052, и параметр нецентрированности 2.6693. 95%-й доверительный интервал для степеней свободы (7.1120,9.0983), и интервал для параметра нецентрированности (1.6025,3.7362). Доверительные интервалы включают истинные значения параметров 8 и 3, соответственно.

Загрузите выборочные данные.

load('readmissiontimes.mat');

Данные включают ReadmissionTime, который имеет времена повторного доступа для 100 пациентов. Эти данные симулированы.

Задайте пользовательский журнал PDF для распределения Weibull с масштабным коэффициентом lambda и параметр формы k.

custlogpdf = @(data,lambda,k) ...
    log(k) - k*log(lambda) + (k-1)*log(data) - (data/lambda).^k;

Оцените параметры пользовательского дистрибутива и задайте его начальные значения параметров (Start аргумент значения имени).

phat = mle(ReadmissionTime,'logpdf',custlogpdf,'Start',[1,0.75])
phat = 1×2

    7.5727    1.4540

Шкала и параметры формы пользовательского дистрибутива 7.5727 и 1.4540, соответственно.

Загрузите выборочные данные.

load('readmissiontimes.mat')

Данные включают ReadmissionTime, который имеет времена повторного доступа для 100 пациентов. Эти данные симулированы.

Задайте пользовательскую отрицательную функцию логарифмической правдоподобности для распределения Пуассона параметром lambda, где 1/lambda среднее значение распределения. Необходимо задать функцию, чтобы принять логический вектор из информации о цензуре и целочисленный вектор из частот данных, даже если вы не используете эти значения в пользовательской функции.

custnloglf = @(lambda,data,cens,freq) ...
    - length(data)*log(lambda) + sum(lambda*data,'omitnan');

Оцените параметр пользовательского дистрибутива и задайте его начальное значение параметров (Start аргумент значения имени).

phat = mle(ReadmissionTime,'nloglf',custnloglf,'Start',0.05)
phat = 0.1462

Сгенерируйте выборочные данные размера 1000 от нецентрального распределения хи-квадрат со степенями свободы 10 и параметр нецентрированности 5.

rng('default') % For reproducibility
x = ncx2rnd(10,5,1000,1);

Предположим, что параметр нецентрированности фиксируется в значении 5. Оцените степени свободы нецентрального распределения хи-квадрат от выборочных данных. Для этого задайте пользовательский нецентральный хи-квадрат PDF с помощью pdf аргумент значения имени.

[phat,pci] = mle(x,'pdf',@(x,v)ncx2pdf(x,v,5),'Start',1)
phat = 9.9307
pci = 2×1

    9.5626
   10.2989

Оценка для параметра нецентрированности 9.9307, и нижние и верхние пределы 95%-го доверительного интервала 9.5626 и 10.2989. Доверительный интервал включает истинное значение параметров 10.

Добавьте масштабный коэффициент в распределение хи-квадрат для адаптации к шкале данных и соответствуйте распределению.

Сгенерируйте выборочные данные размера 1000 от распределения хи-квадрат со степенями свободы 5 и масштабируйте данные на коэффициент 100.

rng default % For reproducibility
x = 100*chi2rnd(5,1000,1);

Оцените степени свободы и масштабный коэффициент. Для этого задайте пользовательскую функцию плотности вероятности хи-квадрата с помощью pdf аргумент значения имени. Функция плотности требует a 1/s фактор для данных, масштабируемых s.

[phat,pci] = mle(x,'pdf',@(x,v,s)chi2pdf(x/s,v)/s,'Start',[1,200])
phat = 1×2

    5.1079   99.1681

pci = 2×2

    4.6862   90.1215
    5.5297  108.2146

Оценка для степеней свободы 5.1079, и шкала 99.1681. 95%-й доверительный интервал для степеней свободы (4.6862,5.5279), и интервал для масштабного коэффициента (90.1215,108.2146). Доверительные интервалы включают истинные значения параметров 5 и 100, соответственно.

Загрузите выборочные данные.

load('readmissiontimes.mat');

Данные включают ReadmissionTime, который имеет времена повторного доступа для 100 пациентов. Вектор-столбец Censored содержит информацию о цензуре для каждого пациента, где 1 указывает, что подвергнутое цензуре правом наблюдение, и 0 указывает, что точное время повторного доступа наблюдается. Эти данные симулированы.

Задайте пользовательскую функцию плотности вероятности (PDF) и кумулятивная функция распределения (cdf) для экспоненциального распределения параметром lambda, где 1/lambda среднее значение распределения. Чтобы соответствовать распределению к подвергнутому цензуре набору данных, необходимо передать и PDF и cdf к mle функция.

custpdf = @(data,lambda) lambda*exp(-lambda*data);
custcdf = @(data,lambda) 1-exp(-lambda*data);

Оцените параметр lambda из пользовательского дистрибутива для подвергнутых цензуре выборочных данных. Задайте начальное значение параметров (Start аргумент значения имени) для пользовательского дистрибутива.

phat = mle(ReadmissionTime,'pdf',custpdf,'cdf',custcdf, ...
    'Start',0.05,'Censoring',Censored)
phat = 0.1096

Сгенерируйте дважды подвергнутые цензуре данные о выживании и найдите MLEs для встроенного распределения данных. Затем используйте MLEs, чтобы создать объект вероятностного распределения.

Сгенерируйте времена отказа от распределения Бирнбаума-Сондерса.

rng('default')  % For reproducibility
failuretime = random('BirnbaumSaunders',0.3,1,[100,1]);

Примите, что исследование запускается во время 0.1 и заканчивается во время 0.9. Предположение подразумевает, что времена отказа, меньше чем 0,1 оставляют подвергнутыми цензуре, и времена отказа, больше, чем 0,9, правильные подвергнутый цензуре.

Создайте вектор, в котором каждый элемент указывает на состояние цензуры соответствующего наблюдения в failuretime. Используйте –1, 1, и 0, чтобы указать на лево-подвергнутые цензуре, подвергнутые цензуре правом, и полностью наблюдаемые наблюдения, соответственно.

L = 0.1;
U = 0.9;
left_censored = (failuretime<L);
right_censored = (failuretime>U);
c = right_censored - left_censored;

Найдите MLEs для дважды подвергнутых цензуре данных. Укажите информацию цензуры при помощи Censoring аргумент значения имени.

phat = mle(failuretime,'Distribution','BirnbaumSaunders','Censoring',c)
phat = 1×2

    0.2632    1.3040

Создайте объект вероятностного распределения с MLEs при помощи makedist функция.

pd = makedist('BirnbaumSaunders','beta',phat(1),'gamma',phat(2))
pd = 
  BirnbaumSaundersDistribution

  Birnbaum-Saunders distribution
     beta = 0.263184
    gamma =    1.304

pd BirnbaumSaundersDistribution объект. Можно использовать объектные функции pd вычислять распределение и сгенерировать случайные числа. Отобразите поддерживаемые объектные функции.

methods(pd)
Methods for class prob.BirnbaumSaundersDistribution:

cdf        iqr        negloglik  proflik    truncate   
gather     mean       paramci    random     var        
icdf       median     pdf        std        

Например, вычислите среднее значение и отклонение распределения при помощи mean и var функции, соответственно.

mean(pd)
ans = 0.4869
var(pd)
ans = 0.3681

Сгенерируйте выборочные данные, которые представляют времена аппаратного сбоя после распределения Weibull.

rng('default') % For reproducibility
failureTimes = wblrnd(5,2,[200,1]);

Укажите, что наблюдаемые времена отказа являются значениями, округленными к ближайшей секунде.

observed = round(failureTimes);

observed подвергнутые цензуре интервалом данные. Наблюдение t в observed указывает, что событие имело место после времени t–0.5 и перед временем t+0.5.

Создайте матрицу 2D столбца, которая включает информацию о цензуре.

intervalTimes = [observed-0.5 observed+0.5];

Время отказа должно быть положительным. Найдите значения меньшими, чем eps, и измените их в eps.

intervalTimes(intervalTimes < eps) = eps;

Найдите MLEs для параметров распределения Weibull при помощи intervalTimes.

params = mle(intervalTimes,'Distribution','Weibull')
params = 1×2

    5.0067    2.0049

Постройте график результатов.

figure
histogram(observed,'Normalization','pdf')
hold on
x = linspace(0,max(observed));
plot(x,wblpdf(x,params(1),params(2)))
legend('Observed Samples','Fitted Distribution')
hold off

Figure contains an axes object. The axes object contains 2 objects of type histogram, line. These objects represent Observed Samples, Fitted Distribution.

Сгенерируйте выборки от распределения с конечной поддержкой и найдите MLEs с индивидуально настраиваемыми опциями для итеративного процесса оценки.

Для распределения с областью, которая имеет нулевую плотность вероятности, mle может попробовать некоторые параметры, которые имеют нулевую плотность, заставляя функцию не удаться найти MLEs. Чтобы избежать этой проблемы, можно выключить опцию, которая проверяет на недопустимые значения функции, и задайте границы параметра, когда вы вызываете mle функция.

Сгенерируйте выборочные данные размера 1000 от распределения Weibull с масштабным коэффициентом 1 и сформируйте параметр 1. Переключите выборки путем добавления 10.

rng('default') % For reproducibility
data = wblrnd(1,1,[1000,1]) + 10;
histogram(data,'Normalization','pdf')

Figure contains an axes object. The axes object contains an object of type histogram.

Гистограмма не показывает выборок, меньших, чем 10, указывая, что распределение имеет нулевую вероятность в области, меньшей, чем 10. Это распределение является распределением Weibull с тремя параметрами, которое включает третий параметр для местоположения (см. Распределение Weibull С тремя параметрами).

Задайте функцию плотности вероятности (PDF) для распределения Weibull с тремя параметрами.

custompdf = @(x,a,b,c) wblpdf(x-c,a,b);

Найдите MLEs при помощи mle функция. Задайте Options аргумент значения имени, чтобы выключить опцию, которая проверяет на недопустимые значения функции. Кроме того, задайте границы параметра при помощи LowerBound и UpperBound аргументы name-value. Шкала и параметры формы должны быть положительными, и параметр положения должен быть меньшим, чем минимум выборочных данных.

params = mle(data,'pdf',custompdf,'Start',[5 5 5], ...
     'Options',statset('FunValCheck','off'), ...
     'LowerBound',[0 0 -Inf],'UpperBound',[Inf Inf min(data)])
params = 1×3

    1.0258    1.0618   10.0004

mle функция находит точные оценки для этих трех параметров. Для получения дополнительной информации об определении пользовательских опций для итеративного процесса смотрите пример Распределение Weibull С тремя параметрами.

Входные параметры

свернуть все

Выборочные данные и информация о цензуре в виде вектора из выборочных данных или матрицы 2D столбца выборочных данных и информация о цензуре.

Можно указать информацию цензуры для выборочных данных при помощи любого data аргумент или Censoring аргумент значения имени. mle игнорирует Censoring значение аргумента, если data матрица 2D столбца.

Задайте data как вектор или матрица 2D столбца в зависимости от типов цензуры наблюдений в data.

  • Полностью наблюдаемые данные — Задают data как вектор из выборочных данных.

  • Данные, которые содержат полностью наблюдаемые, лево-подвергнутые цензуре, или подвергнутые цензуре правом наблюдения — Задают data как вектор из выборочных данных, и задают Censoring аргумент значения имени как вектор, который содержит информацию о цензуре для каждого наблюдения. Censoring вектор может содержать 0, –1, и 1, которые относятся к полностью наблюдаемым, лево-подвергнутым цензуре, и подвергнутым цензуре правом наблюдениям, соответственно.

  • Данные, которые включают подвергнутые цензуре интервалом наблюдения — Задают data как матрица 2D столбца выборочных данных и информации о цензуре. Каждая строка data указывает диапазон возможных времен выживания или отказа для каждого наблюдения и может иметь одно из этих значений:

    • [t,t] — Полностью наблюдаемый в t

    • [–Inf,t] — Лево-подвергнутый цензуре в t

    • [t,Inf] — Подвергнутый цензуре правом в t

    • [t1,t2] — Подвергнутый цензуре интервалом между [t1,t2], где t1 <t2

    Для списка встроенных распределений, которые поддерживают подвергнутые цензуре наблюдения, смотрите Censoring.

    mle игнорирует NaN значения в data. Кроме того, любой NaN значения в векторе цензурирования (Censoring) или вектор частоты (Frequency) причина mle проигнорировать соответствующие строки в data.

Типы данных: single | double

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Censoring',Cens,'Alpha',0.01,'Options',Opt сообщает mle оценить параметры для распределения подвергнутых цензуре данных, заданных массивом Cens, вычислите 99% пределов достоверности для оценок параметра и используйте параметры управления алгоритмом, заданные структурой Opt.
Опции, чтобы задать встроенное распределение

свернуть все

Тип распределения, для которого можно оценить параметры в виде одного из значений в этой таблице.

Distribution ЗначениеТип распределенияПервый параметрВторой параметрТретий параметрЧетвертый параметр
'Bernoulli'Бернуллиевое распределениеp: вероятность успеха для каждого испытанияN/AN/AN/A
'Beta'Бета распределениеa: сначала сформируйте параметрb: второй параметр формыN/AN/A
'Binomial'Биномиальное распределениеp: вероятность успеха для каждого испытанияN/AN/AN/A
'BirnbaumSaunders'Распределение Бирнбаума-Сондерсаβ: масштабный коэффициентγ: сформируйте параметрN/AN/A
'Burr'Подпилите распределение типа XIIα: масштабный коэффициентc: сначала сформируйте параметрk: второй параметр формыN/A
'Discrete Uniform' или 'unid'(Дискретное) равномерное распределениеn: максимальное заметное значениеN/AN/AN/A
'Exponential'Экспоненциальное распределениеμ: среднее значениеN/AN/AN/A
'Extreme Value' или 'ev'Распределение экстремумаμ: параметр положенияσ: масштабный коэффициентN/AN/A
'Gamma'Гамма распределениеa: сформируйте параметрb: масштабный коэффициентN/AN/A
'Generalized Extreme Value' или 'gev'Обобщенное распределение экстремумаk: сформируйте параметрσ: масштабный коэффициентμ: параметр положенияN/A
'Generalized Pareto' или 'gp'Обобщенное распределение Паретоk: индекс хвоста (форма) параметрσ: масштабный коэффициентN/AN/A
'Geometric'Геометрическое распределениеp: параметр вероятностиN/AN/AN/A
'Half Normal' или 'hn'Полунормальное распределениеσ: масштабный коэффициентN/AN/AN/A
'InverseGaussian'Обратное распределение Гауссаμ: масштабный коэффициентλ: сформируйте параметрN/AN/A
'Logistic'Логистическое распределениеμ: среднее значение σ: масштабный коэффициентN/AN/A
'LogLogistic'Распределение Loglogisticμ: среднее значение логарифмических значенийσ: масштабный коэффициент логарифмических значенийN/AN/A
'LogNormal'Логарифмически нормальное распределениеμ: среднее значение логарифмических значенийσ: стандартное отклонение логарифмических значенийN/AN/A
'Nakagami'Распределение Nakagamiμ: сформируйте параметрω: масштабный коэффициентN/AN/A
'Negative Binomial' или 'nbin'Отрицательное биномиальное распределениеr: количество успеховp: вероятность успеха в одном испытанииN/AN/A
'Normal'Нормальное распределениеμ: среднее значение σ: стандартное отклонениеN/AN/A
'Poisson'Распределение Пуассонаλ: среднее значениеN/AN/AN/A
'Rayleigh'Распределение Релеяb: масштабный коэффициентN/AN/AN/A
'Rician'Распределение Ricians: параметр нецентрированностиσ: масштабный коэффициентN/AN/A
'Stable'Устойчивое распределениеα: сначала сформируйте параметрβ: второй параметр формыγ: масштабный коэффициентδ: параметр положения
'tLocationScale't Распределение Шкалы Местоположенияμ: параметр положенияσ: масштабный коэффициентν: сформируйте параметрN/A
'Uniform'(Непрерывное) равномерное распределениеa: более низкая конечная точка (минимум)b: верхняя конечная точка (максимум)N/AN/A
'Weibull' или 'wbl'Распределение Weibulla: масштабный коэффициентb: сформируйте параметрN/AN/A

mle не оценивает эти параметры распределения:

  • Количество испытаний за биномиальное распределение. Задайте параметр при помощи NTrials аргумент значения имени.

  • Параметр положения полунормального распределения. Задайте параметр при помощи mu аргумент значения имени.

  • Параметр положения обобщенного распределения Парето. Задайте параметр при помощи theta аргумент значения имени.

Если выборочные данные являются усеченными или включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения, необходимо задать Start аргумент значения имени для распределения Берра и устойчивого распределения.

Пример: 'Distribution','Rician'

Количество испытаний за соответствующий элемент data для биномиального распределения в виде скаляра или вектора с одинаковым числом строк как data.

Этот аргумент требуется когда Distribution 'Binomial' (биномиальное распределение).

Пример: 'Ntrials',10

Типы данных: single | double

Местоположение (порог) параметр для обобщенного распределения Парето в виде скаляра.

Этот аргумент допустим только когда Distribution 'Generalized Pareto' (обобщенное распределение Парето).

Значение по умолчанию 0 когда выборочные данные data включает только неотрицательные значения. Необходимо задать theta если data включает отрицательные величины.

Пример: 'theta',1

Типы данных: single | double

Параметр положения для полунормального распределения в виде скаляра.

Этот аргумент допустим только когда Distribution 'Half Normal' (полунормальное распределение).

Значение по умолчанию 0 когда выборочные данные data включает только неотрицательные значения. Необходимо задать mu если data включает отрицательные величины.

Пример: 'mu',1

Типы данных: single | double

Опции, чтобы задать пользовательский дистрибутив

свернуть все

Пользовательская функция распределения вероятностей (PDF) в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.

Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из значений плотности вероятности.

Пример: 'pdf',@newpdf

Типы данных: function_handle | cell

Пользовательская кумулятивная функция распределения (cdf) в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.

Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из cdf значений.

Чтобы вычислить MLEs для подвергнутых цензуре или усеченных наблюдений, необходимо задать оба cdf и pdf. Для полностью наблюдаемых и неусеченных наблюдений, mle не использует cdf. Можно указать информацию цензуры при помощи любого data или Censoring и задайте границы усечения при помощи TruncationBounds.

Пример: 'cdf',@newcdf

Типы данных: function_handle | cell

Пользовательская логарифмическая функция плотности вероятности в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.

Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из логарифмических значений вероятности.

Пример: 'logpdf',@customlogpdf

Типы данных: function_handle | cell

Пользовательское логарифмическое выживание функционирует в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.

Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из логарифмических значений вероятности выживания.

Чтобы вычислить MLEs для подвергнутых цензуре или усеченных наблюдений, необходимо задать оба logsf и logpdf. Для полностью наблюдаемых и неусеченных наблюдений, mle не использует logsf. Можно указать информацию цензуры при помощи любого data или Censoring и задайте границы усечения при помощи TruncationBounds.

Пример: 'logsf',@logsurvival

Типы данных: function_handle | cell

Пользовательская отрицательная логарифмическая правдоподобность функционирует в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.

Пользовательская функция принимает следующие входные параметры в перечисленном в таблице порядке.

Входной параметр пользовательской функцииОписание
paramsВектор из значений параметра распределения. mle обнаруживает количество параметров от числа элементов в Start.
dataВыборочные данные. data значение является вектором из выборочных данных или матрицей 2D столбца информации о цензуре и выборочных данных.
censЛогический вектор из информации о цензуре. nloglf должен принять cens даже если вы не используете Censoring аргумент значения имени. В этом случае можно записать nloglf проигнорировать cens.
freqЦелочисленный вектор из частот данных. nloglf должен принять freq даже если вы не используете Frequency аргумент значения имени. В этом случае можно записать nloglf проигнорировать freq.
truncДвухэлементный числовой вектор из границ усечения. nloglf должен принять trunc если вы используете TruncationBounds аргумент значения имени.

nloglf может опционально принять дополнительные аргументы, переданные массивом ячеек как входные параметры.

nloglf возвращает скалярное отрицательное значение логарифмической правдоподобности и, опционально, отрицательный вектор градиента логарифмической правдоподобности (см. GradObj поле в Options аргумент значения имени).

Пример: 'nloglf',@negloglik

Типы данных: function_handle | cell

Другие опции

свернуть все

Индикатор подвергнутых цензуре данных в виде вектора, состоящего из 0, –1, и 1, которые указывают на полностью наблюдаемые, лево-подвергнутые цензуре, и подвергнутые цензуре правом наблюдения, соответственно. Каждый элемент Censoring значение указывает на состояние цензуры соответствующего наблюдения в data. Censoring значение должно иметь тот же размер как data. Значением по умолчанию является вектор из 0s, указывая, что все наблюдения полностью наблюдаются.

Вы не можете задать подвергнутые цензуре интервалом наблюдения с помощью этого аргумента. Если выборочные данные включают подвергнутые цензуре интервалом наблюдения, задайте data использование матрицы 2D столбца. mle игнорирует Censoring значение, если data матрица 2D столбца.

mle цензурирование поддержек для следующих встроенных распределений и пользовательского дистрибутива.

Distribution ЗначениеТип распределения
'BirnbaumSaunders'

Бирнбаум-Сондерс

'Burr'

Подпилите тип XII

'Exponential'

Экспоненциал

'Extreme Value' или 'ev'

Экстремум

'Gamma'

\Gamma

'InverseGaussian'

Гауссова инверсия

'Logistic'

Логистический

'LogLogistic'

Loglogistic

'LogNormal'

Логарифмически нормальный

'Nakagami'

Nakagami

'Normal'

Нормальный

'Rician'

Rician

'tLocationScale'

Шкала местоположения t

'Weibull' или 'wbl'

Weibull

Для пользовательского дистрибутива необходимо задать распределение при помощи pdf и cdf, logpdf и logsf, или nloglf.

mle игнорирует любой NaN значения в векторе цензурирования. Кроме того, любой NaN значения в data или вектор частоты (Frequency) причина mle проигнорировать соответствующие значения в векторе цензурирования.

Пример: 'Censoring',censored, где censored вектор, который содержит информацию о цензуре.

Типы данных: логический | single | double

Усечение ограничивает в виде вектора из двух элементов.

mle поддерживает усеченные наблюдения для следующих встроенных распределений и пользовательского дистрибутива.

Distribution ЗначениеТип распределения
'Beta'

\beta

'BirnbaumSaunders'

Бирнбаум-Сондерс

'Burr'

Шум

'Exponential'

Экспоненциал

'Extreme Value' или 'ev'

Экстремум

'Gamma'

\Gamma

'Generalized Extreme Value' или 'gev'

Обобщенный экстремум

'Generalized Pareto' или 'gp'

Обобщенный Парето

'Half Normal' или 'hn'

Полунормальный

'InverseGaussian'

Гауссова инверсия

'Logistic'

Логистический

'LogLogistic'

Loglogistic

'LogNormal'

Логарифмически нормальный

'Nakagami'

Nakagami

'Normal'

Нормальный

'Poisson'

Пуассон

'Rayleigh'

Рэлеевский

'Rician'

Rician

'Stable'

Устойчивый

'tLocationScale'

Шкала местоположения t

'Weibull' или 'wbl'

Weibull

Для пользовательского дистрибутива необходимо задать распределение при помощи pdf и cdf, logpdf и logsf, или nloglf.

Пример: 'TruncationBounds',[0,10]

Типы данных: single | double

Частота наблюдений в виде вектора из неотрицательных целочисленных количеств, который имеет одинаковое число строк как data. jэлемент th Frequency значение дает числу раз jстрока th data наблюдался. Значением по умолчанию является вектор 1 с, указывая на одно наблюдение на строку data.

mle игнорирует любой NaN значения в этом векторе частоты. Кроме того, любой NaN значения в data или вектор цензурирования (Censoring) причина mle проигнорировать соответствующие значения в векторе частоты.

Пример: 'Frequency',freq, где freq вектор, который содержит частоты наблюдения.

Типы данных: single | double

Уровень значения для доверительного интервала pci из параметра оценивает в виде скаляра в области значений (0,1). Доверительный уровень pci 100(1–Alpha)%. Значением по умолчанию является 0.05 для 95%-го доверия.

Пример: 'Alpha',0.01 задает доверительный уровень как 99%.

Типы данных: single | double

Опции для итеративного алгоритма в виде структуры, возвращенной statset.

Используйте этот аргумент, чтобы управлять деталями оптимизации наибольшего правдоподобия. Этот аргумент допустим в следующих случаях:

  • Выборочные данные являются усеченными.

  • Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.

  • Вы соответствуете пользовательскому дистрибутиву.

mle функция интерпретирует следующее statset опции для оптимизации.

Имя поляОписаниеЗначение по умолчанию
GradObj

Отметьте указание ли fmincon может ожидать nloglf пользовательская функция, чтобы возвратить вектор градиента из отрицательной логарифмической правдоподобности как второй выход в виде 'on' или 'off'.

Для примера предоставления градиента к fmincon, смотрите Избегают Числовых Проблем При Подборе кривой Пользовательским дистрибутивам.

mle игнорирует GradObj при использовании fminsearch. Можно задать оптимизационную функцию при помощи OptimFun аргумент значения имени. Оптимизационной функцией по умолчанию является fminsearch.

'off'
DerivStep

Относительная разница в виде вектора одного размера с Start и используемый в приближениях производной конечной разности, когда mle использование fmincon и GradObj 'off'.

mle игнорирует DerivStep при использовании fminsearch.

eps^(1/3)
FunValCheck

Отметьте указание ли mle проверяет значения, возвращенные функциями распределения для валидности в виде 'on' или 'off'.

Плохой выбор для начальной точки может заставить функции распределения возвращать NaNs, бесконечные значения или значения из области значений, если вы задаете функцию без подходящей проверки ошибок.

'on'
TolBnd

Возместите для нижних и верхних границ когда mle использование fminconВ виде положительной скалярной величины.

mle обрабатывает нижние и верхние границы как строгие неравенства или открытые границы. При использовании fmincon, mle аппроксимирует границы включением смещения, заданного TolBnd для нижних и верхних границ.

1e-6
TolFun

Допуск завершения на значении функции в виде положительной скалярной величины.

1e-6
TolX

Допуск завершения к параметрам в виде положительной скалярной величины.

1e-6
MaxFunEvals

Максимальное количество вычислений функции позволено в виде положительного целого числа.

400
MaxIter

Максимальное количество итераций позволено в виде положительного целого числа.

200
Display

Level of display в виде 'off', 'final', или 'iter'.

  • 'off' — Не отобразите информацию.

  • 'final' — Отобразите итоговую информацию.

  • 'iter' — Отобразите информацию в каждой итерации

'off'

Для примеров Options аргумент значения имени, смотрите, Находят MLEs для Распределения с Конечной Поддержкой и Распределения Weibull С тремя параметрами.

Для получения дополнительной информации смотрите options входной параметр fminsearch и fmincon (Optimization Toolbox).

Пример: 'Options',statset('FunValCheck','off')

Типы данных: struct

Начальные значения параметров для распределения Берра, устойчивого распределения и пользовательских дистрибутивов в виде вектора-строки. Длина Start значение должно совпасть с количеством параметров, оцененных mle.

Если выборочные данные являются усеченными или включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения, Start аргумент требуется для Шума и устойчивых распределений. Этот аргумент всегда требуется, когда вы соответствуете пользовательскому дистрибутиву, то есть, когда вы используете pdf, logpdf, или nloglf аргумент значения имени. Для других случаев, mle может или найти начальные значения или вычислить MLEs без начальных значений.

Пример: 0.05

Пример: [100,2]

Типы данных: single | double

Нижние границы для параметров распределения в виде вектора-строки из той же длины как Start.

Этот аргумент допустим в следующих случаях:

  • Выборочные данные являются усеченными.

  • Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.

  • Вы соответствуете пользовательскому дистрибутиву.

Пример: 'Lowerbound',0

Типы данных: single | double

Верхние границы для параметров распределения в виде вектора-строки из той же длины как Start.

Этот аргумент допустим в следующих случаях:

  • Выборочные данные являются усеченными.

  • Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.

  • Вы соответствуете пользовательскому дистрибутиву.

Пример: 'Upperbound',1

Типы данных: single | double

Оптимизационная функция используется mle использование, чтобы максимизировать вероятность в виде любого 'fminsearch' или 'fmincon'. 'fmincon' опция требует Optimization Toolbox™.

  • Выборочные данные являются усеченными.

  • Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.

  • Вы соответствуете пользовательскому дистрибутиву.

Пример: 'Optimfun','fmincon'

Выходные аргументы

свернуть все

Оценки параметра, возвращенные как вектор-строка. Для описания оценок параметра для встроенных распределений смотрите Distribution.

Доверительные интервалы для оценок параметра, возвращенных как 2 k матрицей, где k является количеством параметров, оцененных mle. Первые и вторые строки pci покажите более низкие и верхние пределы достоверности, соответственно.

Можно задать уровень значения для доверительного интервала при помощи Alpha аргумент значения имени.

Больше о

свернуть все

Типы цензуры

mle поддержки лево-подвергнутые цензуре, подвергнутые цензуре правом, и подвергнутые цензуре интервалом наблюдения.

  • Лево-подвергнутое цензуре наблюдение во время t — Событие имело место перед временем t, и точное время события неизвестно.

  • Подвергнутое цензуре правом наблюдение во время t — Событие имело место после времени t, и точное время события неизвестно.

  • Подвергнутое цензуре интервалом наблюдение в интервале [t1,t2] — Событие имело место после времени t1 и перед временем t2, и точное время события неизвестно.

Дважды подвергнутые цензуре данные включают и лево-подвергнутые цензуре и подвергнутые цензуре правом наблюдения.

Функция выживания

Функция выживания является вероятностью выживания в зависимости от времени. Это также вызвано функция оставшегося в живых.

Функция выживания дает вероятность, что время выживания индивидуума превышает определенное значение. Поскольку кумулятивная функция распределения, F (t) является вероятностью, что время выживания меньше чем или равно данной точке t вовремя, функция выживания для непрерывного распределения S (t), является дополнением кумулятивной функции распределения: S (t) = 1 – F (t).

Советы

  • Когда вы предоставляете функции пользовательского дистрибутива или используете встроенные распределения для лево-подвергнутых цензуре, дважды подвергнутых цензуре, подвергнутых цензуре интервалом, или усеченных наблюдений, mle вычисляет оценки параметра с помощью итеративного алгоритма максимизации. С некоторыми моделями и данными, плохим выбором для начальной точки (Start) может вызвать mle сходиться к локальному оптимуму, который не является глобальной переменной maximizer, или не удаваться сходиться полностью. Даже в случаях, для которых логарифмическая правдоподобность хорошего поведения около глобального максимума, выбор начальной точки часто крайне важен для сходимости алгоритма. В частности, если начальные значения параметров далеки от MLEs, потеря значимости в функциях распределения может привести к бесконечной логарифмической правдоподобности.

Алгоритмы

  • mle функция находит MLEs путем минимизации отрицательной функции логарифмической правдоподобности (то есть, максимизации функции логарифмической правдоподобности) или при помощи решения закрытой формы, при наличии. Целевая функция является отрицательным значением логарифма продукта выборочных данных (X) вероятности, учитывая параметры распределения (θ):

    Objective Function=logxXP(x|θ)

    Функция вероятности P зависит от информации о цензуре для каждого наблюдения.

    • Полностью наблюдаемое наблюдение — P (x |θ) = f (x), где f является функцией плотности вероятности (PDF) параметрами θ.

    • Лево-подвергнутое цензуре наблюдение — P (x |θ) = F (x), где F является кумулятивной функцией распределения (cdf) параметрами θ.

    • Подвергнутое цензуре правом наблюдение — P (x |θ) = 1 – F (x).

    • Подвергнутое цензуре интервалом наблюдение между xL и xUP (x |θ) = F (xU) – F (xL).

    Для усеченных данных, mle масштабирует функции распределения так, чтобы все вероятности легли в границах усечения [L, U].

    ftruncation(x)={f(x)F(U)F(L),если LxU,0,В противном случае.

    Ftruncation(x)={F(x)F(L)F(U)F(L),если LxU,0,1,если x<L,если x>U.

  • mle функция вычисляет доверительные интервалы pci использование точного метода, когда это доступно, и когда выборочные данные не являются усеченными и не включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения. В противном случае функция использует Вальдов метод. Точный метод доступен для этих распределений: бином, дискретная универсальная форма, экспоненциальная, нормальная, логарифмически нормальная, Пуассон, Рэлеевская, и непрерывная универсальная форма.

Расширенные возможности

Представлено до R2006a