Оценки наибольшего правдоподобия
задает опции с помощью одних или нескольких аргументов name-value.phat
= mle(data
,Name,Value
)
Например, можно задать тип распределения при помощи одних из этих аргументов name-value: Distribution
, pdf
, logpdf
, или nloglf
.
Чтобы вычислить MLEs для встроенного распределения, задайте тип распределения при помощи Distribution
. Например,
задает, чтобы вычислить MLEs для бета распределения.'Distribution'
\beta
Чтобы вычислить MLEs для пользовательского дистрибутива, задайте распределение при помощи pdf
, logpdf
, или nloglf
, и задайте начальные значения параметров при помощи Start
.
Найдите MLEs для встроенного распределения, что вы задаете использование Distribution
аргумент значения имени.
Загрузите выборочные данные.
load carbig
Переменная MPG
содержит мили на галлон для различных моделей автомобилей.
Чертите гистограмму MPG
данные.
histogram(MPG)
Распределение несколько правильно скошенный. Симметричное распределение, такое как нормальное распределение, не может быть подходящим вариантом.
Оцените параметры распределения Типа XII Шума для MPG
данные.
phat = mle(MPG,'Distribution','burr')
phat = 1×3
34.6447 3.7898 3.5722
MLE для масштабного коэффициента α 34.6447. Оценки для двух параметров формы и из Шума распределение Типа XII 3.7898 и 3.5722, соответственно.
Сгенерируйте 100 случайных наблюдений от биномиального распределения с количеством испытаний = 20 и вероятность успеха = 0.75.
rng('default') % For reproducibility data = binornd(20,0.75,100,1);
Оцените вероятность успеха и 99%-х пределов достоверности с помощью симулированных выборочных данных. Необходимо задать количество испытаний (NTrials
) для биномиального распределения.
[phat,pci] = mle(data,'Distribution','binomial','NTrials',20, ... 'Alpha',.01)
phat = 0.7615
pci = 2×1
0.7361
0.7856
Оценка вероятности успеха 0.7615, и нижние и верхние пределы 99%-го доверительного интервала 0.7361 и 0.7856, соответственно. Этот интервал покрывает истинное значение, используемое, чтобы симулировать данные.
Сгенерируйте выборочные данные размера 1000 от нецентрального распределения хи-квадрат со степенями свободы 8 и параметр нецентрированности 3.
rng default % for reproducibility x = ncx2rnd(8,3,1000,1);
Оцените параметры нецентрального распределения хи-квадрат от выборочных данных. Distribution
аргумент значения имени не поддерживает нецентральное распределение хи-квадрат. Поэтому необходимо задать пользовательский нецентральный хи-квадрат PDF с помощью pdf
аргумент значения имени и ncx2pdf
функция. Необходимо также задать начальные значения параметров (Start
аргумент значения имени) для пользовательского дистрибутива.
[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,d),'Start',[1,1])
phat = 1×2
8.1052 2.6693
pci = 2×2
7.1120 1.6025
9.0983 3.7362
Оценка для степеней свободы 8.1052, и параметр нецентрированности 2.6693. 95%-й доверительный интервал для степеней свободы (7.1120,9.0983), и интервал для параметра нецентрированности (1.6025,3.7362). Доверительные интервалы включают истинные значения параметров 8 и 3, соответственно.
Загрузите выборочные данные.
load('readmissiontimes.mat');
Данные включают ReadmissionTime
, который имеет времена повторного доступа для 100 пациентов. Эти данные симулированы.
Задайте пользовательский журнал PDF для распределения Weibull с масштабным коэффициентом lambda
и параметр формы k
.
custlogpdf = @(data,lambda,k) ...
log(k) - k*log(lambda) + (k-1)*log(data) - (data/lambda).^k;
Оцените параметры пользовательского дистрибутива и задайте его начальные значения параметров (Start
аргумент значения имени).
phat = mle(ReadmissionTime,'logpdf',custlogpdf,'Start',[1,0.75])
phat = 1×2
7.5727 1.4540
Шкала и параметры формы пользовательского дистрибутива 7.5727 и 1.4540, соответственно.
Загрузите выборочные данные.
load('readmissiontimes.mat')
Данные включают ReadmissionTime
, который имеет времена повторного доступа для 100 пациентов. Эти данные симулированы.
Задайте пользовательскую отрицательную функцию логарифмической правдоподобности для распределения Пуассона параметром lambda
, где 1/lambda
среднее значение распределения. Необходимо задать функцию, чтобы принять логический вектор из информации о цензуре и целочисленный вектор из частот данных, даже если вы не используете эти значения в пользовательской функции.
custnloglf = @(lambda,data,cens,freq) ... - length(data)*log(lambda) + sum(lambda*data,'omitnan');
Оцените параметр пользовательского дистрибутива и задайте его начальное значение параметров (Start
аргумент значения имени).
phat = mle(ReadmissionTime,'nloglf',custnloglf,'Start',0.05)
phat = 0.1462
Сгенерируйте выборочные данные размера 1000 от нецентрального распределения хи-квадрат со степенями свободы 10 и параметр нецентрированности 5.
rng('default') % For reproducibility x = ncx2rnd(10,5,1000,1);
Предположим, что параметр нецентрированности фиксируется в значении 5. Оцените степени свободы нецентрального распределения хи-квадрат от выборочных данных. Для этого задайте пользовательский нецентральный хи-квадрат PDF с помощью pdf
аргумент значения имени.
[phat,pci] = mle(x,'pdf',@(x,v)ncx2pdf(x,v,5),'Start',1)
phat = 9.9307
pci = 2×1
9.5626
10.2989
Оценка для параметра нецентрированности 9.9307, и нижние и верхние пределы 95%-го доверительного интервала 9.5626 и 10.2989. Доверительный интервал включает истинное значение параметров 10.
Добавьте масштабный коэффициент в распределение хи-квадрат для адаптации к шкале данных и соответствуйте распределению.
Сгенерируйте выборочные данные размера 1000 от распределения хи-квадрат со степенями свободы 5 и масштабируйте данные на коэффициент 100.
rng default % For reproducibility x = 100*chi2rnd(5,1000,1);
Оцените степени свободы и масштабный коэффициент. Для этого задайте пользовательскую функцию плотности вероятности хи-квадрата с помощью pdf
аргумент значения имени. Функция плотности требует a фактор для данных, масштабируемых .
[phat,pci] = mle(x,'pdf',@(x,v,s)chi2pdf(x/s,v)/s,'Start',[1,200])
phat = 1×2
5.1079 99.1681
pci = 2×2
4.6862 90.1215
5.5297 108.2146
Оценка для степеней свободы 5.1079, и шкала 99.1681. 95%-й доверительный интервал для степеней свободы (4.6862,5.5279), и интервал для масштабного коэффициента (90.1215,108.2146). Доверительные интервалы включают истинные значения параметров 5 и 100, соответственно.
Загрузите выборочные данные.
load('readmissiontimes.mat');
Данные включают ReadmissionTime
, который имеет времена повторного доступа для 100 пациентов. Вектор-столбец Censored
содержит информацию о цензуре для каждого пациента, где 1 указывает, что подвергнутое цензуре правом наблюдение, и 0 указывает, что точное время повторного доступа наблюдается. Эти данные симулированы.
Задайте пользовательскую функцию плотности вероятности (PDF) и кумулятивная функция распределения (cdf) для экспоненциального распределения параметром lambda
, где 1/lambda
среднее значение распределения. Чтобы соответствовать распределению к подвергнутому цензуре набору данных, необходимо передать и PDF и cdf к mle
функция.
custpdf = @(data,lambda) lambda*exp(-lambda*data); custcdf = @(data,lambda) 1-exp(-lambda*data);
Оцените параметр lambda
из пользовательского дистрибутива для подвергнутых цензуре выборочных данных. Задайте начальное значение параметров (Start
аргумент значения имени) для пользовательского дистрибутива.
phat = mle(ReadmissionTime,'pdf',custpdf,'cdf',custcdf, ... 'Start',0.05,'Censoring',Censored)
phat = 0.1096
Сгенерируйте дважды подвергнутые цензуре данные о выживании и найдите MLEs для встроенного распределения данных. Затем используйте MLEs, чтобы создать объект вероятностного распределения.
Сгенерируйте времена отказа от распределения Бирнбаума-Сондерса.
rng('default') % For reproducibility failuretime = random('BirnbaumSaunders',0.3,1,[100,1]);
Примите, что исследование запускается во время 0.1 и заканчивается во время 0.9. Предположение подразумевает, что времена отказа, меньше чем 0,1 оставляют подвергнутыми цензуре, и времена отказа, больше, чем 0,9, правильные подвергнутый цензуре.
Создайте вектор, в котором каждый элемент указывает на состояние цензуры соответствующего наблюдения в failuretime
. Используйте –1, 1, и 0, чтобы указать на лево-подвергнутые цензуре, подвергнутые цензуре правом, и полностью наблюдаемые наблюдения, соответственно.
L = 0.1; U = 0.9; left_censored = (failuretime<L); right_censored = (failuretime>U); c = right_censored - left_censored;
Найдите MLEs для дважды подвергнутых цензуре данных. Укажите информацию цензуры при помощи Censoring
аргумент значения имени.
phat = mle(failuretime,'Distribution','BirnbaumSaunders','Censoring',c)
phat = 1×2
0.2632 1.3040
Создайте объект вероятностного распределения с MLEs при помощи makedist
функция.
pd = makedist('BirnbaumSaunders','beta',phat(1),'gamma',phat(2))
pd = BirnbaumSaundersDistribution Birnbaum-Saunders distribution beta = 0.263184 gamma = 1.304
pd
BirnbaumSaundersDistribution
объект. Можно использовать объектные функции pd
вычислять распределение и сгенерировать случайные числа. Отобразите поддерживаемые объектные функции.
methods(pd)
Methods for class prob.BirnbaumSaundersDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std
Например, вычислите среднее значение и отклонение распределения при помощи mean
и var
функции, соответственно.
mean(pd)
ans = 0.4869
var(pd)
ans = 0.3681
Сгенерируйте выборочные данные, которые представляют времена аппаратного сбоя после распределения Weibull.
rng('default') % For reproducibility failureTimes = wblrnd(5,2,[200,1]);
Укажите, что наблюдаемые времена отказа являются значениями, округленными к ближайшей секунде.
observed = round(failureTimes);
observed
подвергнутые цензуре интервалом данные. Наблюдение t
в observed
указывает, что событие имело место после времени t–0.5
и перед временем t+0.5
.
Создайте матрицу 2D столбца, которая включает информацию о цензуре.
intervalTimes = [observed-0.5 observed+0.5];
Время отказа должно быть положительным. Найдите значения меньшими, чем eps
, и измените их в eps
.
intervalTimes(intervalTimes < eps) = eps;
Найдите MLEs для параметров распределения Weibull при помощи intervalTimes
.
params = mle(intervalTimes,'Distribution','Weibull')
params = 1×2
5.0067 2.0049
Постройте график результатов.
figure histogram(observed,'Normalization','pdf') hold on x = linspace(0,max(observed)); plot(x,wblpdf(x,params(1),params(2))) legend('Observed Samples','Fitted Distribution') hold off
Сгенерируйте выборки от распределения с конечной поддержкой и найдите MLEs с индивидуально настраиваемыми опциями для итеративного процесса оценки.
Для распределения с областью, которая имеет нулевую плотность вероятности, mle
может попробовать некоторые параметры, которые имеют нулевую плотность, заставляя функцию не удаться найти MLEs. Чтобы избежать этой проблемы, можно выключить опцию, которая проверяет на недопустимые значения функции, и задайте границы параметра, когда вы вызываете mle
функция.
Сгенерируйте выборочные данные размера 1000 от распределения Weibull с масштабным коэффициентом 1 и сформируйте параметр 1. Переключите выборки путем добавления 10.
rng('default') % For reproducibility data = wblrnd(1,1,[1000,1]) + 10; histogram(data,'Normalization','pdf')
Гистограмма не показывает выборок, меньших, чем 10, указывая, что распределение имеет нулевую вероятность в области, меньшей, чем 10. Это распределение является распределением Weibull с тремя параметрами, которое включает третий параметр для местоположения (см. Распределение Weibull С тремя параметрами).
Задайте функцию плотности вероятности (PDF) для распределения Weibull с тремя параметрами.
custompdf = @(x,a,b,c) wblpdf(x-c,a,b);
Найдите MLEs при помощи mle
функция. Задайте Options
аргумент значения имени, чтобы выключить опцию, которая проверяет на недопустимые значения функции. Кроме того, задайте границы параметра при помощи LowerBound
и UpperBound
аргументы name-value. Шкала и параметры формы должны быть положительными, и параметр положения должен быть меньшим, чем минимум выборочных данных.
params = mle(data,'pdf',custompdf,'Start',[5 5 5], ... 'Options',statset('FunValCheck','off'), ... 'LowerBound',[0 0 -Inf],'UpperBound',[Inf Inf min(data)])
params = 1×3
1.0258 1.0618 10.0004
mle
функция находит точные оценки для этих трех параметров. Для получения дополнительной информации об определении пользовательских опций для итеративного процесса смотрите пример Распределение Weibull С тремя параметрами.
data
— Выборочные данные и информация о цензуреВыборочные данные и информация о цензуре в виде вектора из выборочных данных или матрицы 2D столбца выборочных данных и информация о цензуре.
Можно указать информацию цензуры для выборочных данных при помощи любого data
аргумент или Censoring
аргумент значения имени. mle
игнорирует Censoring
значение аргумента, если data
матрица 2D столбца.
Задайте data
как вектор или матрица 2D столбца в зависимости от типов цензуры наблюдений в data
.
Полностью наблюдаемые данные — Задают data
как вектор из выборочных данных.
Данные, которые содержат полностью наблюдаемые, лево-подвергнутые цензуре, или подвергнутые цензуре правом наблюдения — Задают data
как вектор из выборочных данных, и задают Censoring
аргумент значения имени как вектор, который содержит информацию о цензуре для каждого наблюдения. Censoring
вектор может содержать 0, –1, и 1, которые относятся к полностью наблюдаемым, лево-подвергнутым цензуре, и подвергнутым цензуре правом наблюдениям, соответственно.
Данные, которые включают подвергнутые цензуре интервалом наблюдения — Задают data
как матрица 2D столбца выборочных данных и информации о цензуре. Каждая строка data
указывает диапазон возможных времен выживания или отказа для каждого наблюдения и может иметь одно из этих значений:
[t,t]
— Полностью наблюдаемый в t
[–Inf,t]
— Лево-подвергнутый цензуре в t
[t,Inf]
— Подвергнутый цензуре правом в t
[t1,t2]
— Подвергнутый цензуре интервалом между [t1,t2]
, где t1
<t2
Для списка встроенных распределений, которые поддерживают подвергнутые цензуре наблюдения, смотрите Censoring
.
mle
игнорирует NaN
значения в data
. Кроме того, любой NaN
значения в векторе цензурирования (Censoring
) или вектор частоты (Frequency
) причина mle
проигнорировать соответствующие строки в data
.
Типы данных: single
| double
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
'Censoring',Cens,'Alpha',0.01,'Options',Opt
сообщает mle
оценить параметры для распределения подвергнутых цензуре данных, заданных массивом Cens
, вычислите 99% пределов достоверности для оценок параметра и используйте параметры управления алгоритмом, заданные структурой Opt
.Distribution
— Тип распределения'normal'
(значение по умолчанию) | вектор символов или строковый скаляр типа распределенияТип распределения, для которого можно оценить параметры в виде одного из значений в этой таблице.
Distribution Значение | Тип распределения | Первый параметр | Второй параметр | Третий параметр | Четвертый параметр |
---|---|---|---|---|---|
'Bernoulli' | Бернуллиевое распределение | p : вероятность успеха для каждого испытания | N/A | N/A | N/A |
'Beta' | Бета распределение | a : сначала сформируйте параметр | b : второй параметр формы | N/A | N/A |
'Binomial' | Биномиальное распределение | p : вероятность успеха для каждого испытания | N/A | N/A | N/A |
'BirnbaumSaunders' | Распределение Бирнбаума-Сондерса | β: масштабный коэффициент | γ: сформируйте параметр | N/A | N/A |
'Burr' | Подпилите распределение типа XII | α: масштабный коэффициент | c : сначала сформируйте параметр | k : второй параметр формы | N/A |
'Discrete Uniform' или 'unid' | (Дискретное) равномерное распределение | n : максимальное заметное значение | N/A | N/A | N/A |
'Exponential' | Экспоненциальное распределение | μ: среднее значение | N/A | N/A | N/A |
'Extreme Value' или 'ev' | Распределение экстремума | μ: параметр положения | σ: масштабный коэффициент | N/A | N/A |
'Gamma' | Гамма распределение | a : сформируйте параметр | b : масштабный коэффициент | N/A | N/A |
'Generalized Extreme Value' или 'gev' | Обобщенное распределение экстремума | k : сформируйте параметр | σ: масштабный коэффициент | μ: параметр положения | N/A |
'Generalized Pareto' или 'gp' | Обобщенное распределение Парето | k : индекс хвоста (форма) параметр | σ: масштабный коэффициент | N/A | N/A |
'Geometric' | Геометрическое распределение | p : параметр вероятности | N/A | N/A | N/A |
'Half Normal' или 'hn' | Полунормальное распределение | σ: масштабный коэффициент | N/A | N/A | N/A |
'InverseGaussian' | Обратное распределение Гаусса | μ: масштабный коэффициент | λ: сформируйте параметр | N/A | N/A |
'Logistic' | Логистическое распределение | μ: среднее значение | σ: масштабный коэффициент | N/A | N/A |
'LogLogistic' | Распределение Loglogistic | μ: среднее значение логарифмических значений | σ: масштабный коэффициент логарифмических значений | N/A | N/A |
'LogNormal' | Логарифмически нормальное распределение | μ: среднее значение логарифмических значений | σ: стандартное отклонение логарифмических значений | N/A | N/A |
'Nakagami' | Распределение Nakagami | μ: сформируйте параметр | ω: масштабный коэффициент | N/A | N/A |
'Negative Binomial' или 'nbin' | Отрицательное биномиальное распределение | r : количество успехов | p : вероятность успеха в одном испытании | N/A | N/A |
'Normal' | Нормальное распределение | μ: среднее значение | σ: стандартное отклонение | N/A | N/A |
'Poisson' | Распределение Пуассона | λ: среднее значение | N/A | N/A | N/A |
'Rayleigh' | Распределение Релея | b : масштабный коэффициент | N/A | N/A | N/A |
'Rician' | Распределение Rician | s : параметр нецентрированности | σ: масштабный коэффициент | N/A | N/A |
'Stable' | Устойчивое распределение | α: сначала сформируйте параметр | β: второй параметр формы | γ: масштабный коэффициент | δ: параметр положения |
'tLocationScale' | t Распределение Шкалы Местоположения | μ: параметр положения | σ: масштабный коэффициент | ν: сформируйте параметр | N/A |
'Uniform' | (Непрерывное) равномерное распределение | a : более низкая конечная точка (минимум) | b : верхняя конечная точка (максимум) | N/A | N/A |
'Weibull' или 'wbl' | Распределение Weibull | a : масштабный коэффициент | b : сформируйте параметр | N/A | N/A |
mle
не оценивает эти параметры распределения:
Количество испытаний за биномиальное распределение. Задайте параметр при помощи NTrials
аргумент значения имени.
Параметр положения полунормального распределения. Задайте параметр при помощи mu
аргумент значения имени.
Параметр положения обобщенного распределения Парето. Задайте параметр при помощи theta
аргумент значения имени.
Если выборочные данные являются усеченными или включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения, необходимо задать Start
аргумент значения имени для распределения Берра и устойчивого распределения.
Пример: 'Distribution','Rician'
NTrials
— Количество испытаний за биномиальное распределениеКоличество испытаний за соответствующий элемент data
для биномиального распределения в виде скаляра или вектора с одинаковым числом строк как data
.
Этот аргумент требуется когда Distribution
'Binomial'
(биномиальное распределение).
Пример: 'Ntrials',10
Типы данных: single
| double
theta
— Местоположение (порог) параметр для обобщенного распределения ПаретоМестоположение (порог) параметр для обобщенного распределения Парето в виде скаляра.
Этот аргумент допустим только когда Distribution
'Generalized Pareto'
(обобщенное распределение Парето).
Значение по умолчанию 0 когда выборочные данные data
включает только неотрицательные значения. Необходимо задать theta
если data
включает отрицательные величины.
Пример: 'theta',1
Типы данных: single
| double
mu
— Параметр положения для полунормального распределенияПараметр положения для полунормального распределения в виде скаляра.
Этот аргумент допустим только когда Distribution
'Half Normal'
(полунормальное распределение).
Значение по умолчанию 0 когда выборочные данные data
включает только неотрицательные значения. Необходимо задать mu
если data
включает отрицательные величины.
Пример: 'mu',1
Типы данных: single
| double
pdf
— Пользовательская функция плотности вероятностиПользовательская функция распределения вероятностей (PDF) в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.
Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из значений плотности вероятности.
Пример: 'pdf',@newpdf
Типы данных: function_handle
| cell
cdf
— Пользовательская кумулятивная функция распределенияПользовательская кумулятивная функция распределения (cdf) в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.
Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из cdf значений.
Чтобы вычислить MLEs для подвергнутых цензуре или усеченных наблюдений, необходимо задать оба cdf
и pdf
. Для полностью наблюдаемых и неусеченных наблюдений, mle
не использует cdf
. Можно указать информацию цензуры при помощи любого data
или Censoring
и задайте границы усечения при помощи TruncationBounds
.
Пример: 'cdf',@newcdf
Типы данных: function_handle
| cell
logpdf
— Пользовательская логарифмическая функция плотности вероятностиПользовательская логарифмическая функция плотности вероятности в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.
Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из логарифмических значений вероятности.
Пример: 'logpdf',@customlogpdf
Типы данных: function_handle
| cell
logsf
— Пользовательская логарифмическая функция выживанияПользовательское логарифмическое выживание функционирует в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.
Пользовательская функция принимает вектор, содержащий выборочные данные, один или несколько отдельных параметров распределения и любые дополнительные аргументы, переданные массивом ячеек как входные параметры. Функция возвращает вектор из логарифмических значений вероятности выживания.
Чтобы вычислить MLEs для подвергнутых цензуре или усеченных наблюдений, необходимо задать оба logsf
и logpdf
. Для полностью наблюдаемых и неусеченных наблюдений, mle
не использует logsf
. Можно указать информацию цензуры при помощи любого data
или Censoring
и задайте границы усечения при помощи TruncationBounds
.
Пример: 'logsf',@logsurvival
Типы данных: function_handle
| cell
nloglf
— Пользовательская отрицательная функция логарифмической правдоподобностиПользовательская отрицательная логарифмическая правдоподобность функционирует в виде указателя на функцию или массива ячеек, содержащего указатель на функцию и дополнительные аргументы к функции.
Пользовательская функция принимает следующие входные параметры в перечисленном в таблице порядке.
Входной параметр пользовательской функции | Описание |
---|---|
params | Вектор из значений параметра распределения. mle обнаруживает количество параметров от числа элементов в Start . |
data | Выборочные данные. data значение является вектором из выборочных данных или матрицей 2D столбца информации о цензуре и выборочных данных. |
cens | Логический вектор из информации о цензуре. nloglf должен принять cens даже если вы не используете Censoring аргумент значения имени. В этом случае можно записать nloglf проигнорировать cens . |
freq | Целочисленный вектор из частот данных. nloglf должен принять freq даже если вы не используете Frequency аргумент значения имени. В этом случае можно записать nloglf проигнорировать freq . |
trunc | Двухэлементный числовой вектор из границ усечения. nloglf должен принять trunc если вы используете TruncationBounds аргумент значения имени. |
nloglf
может опционально принять дополнительные аргументы, переданные массивом ячеек как входные параметры.
nloglf
возвращает скалярное отрицательное значение логарифмической правдоподобности и, опционально, отрицательный вектор градиента логарифмической правдоподобности (см. GradObj
поле в Options
аргумент значения имени).
Пример: 'nloglf',@negloglik
Типы данных: function_handle
| cell
Censoring
— Индикатор подвергнутых цензуре данныхИндикатор подвергнутых цензуре данных в виде вектора, состоящего из 0, –1, и 1, которые указывают на полностью наблюдаемые, лево-подвергнутые цензуре, и подвергнутые цензуре правом наблюдения, соответственно. Каждый элемент Censoring
значение указывает на состояние цензуры соответствующего наблюдения в data
. Censoring
значение должно иметь тот же размер как data
. Значением по умолчанию является вектор из 0s, указывая, что все наблюдения полностью наблюдаются.
Вы не можете задать подвергнутые цензуре интервалом наблюдения с помощью этого аргумента. Если выборочные данные включают подвергнутые цензуре интервалом наблюдения, задайте data
использование матрицы 2D столбца. mle
игнорирует Censoring
значение, если data
матрица 2D столбца.
mle
цензурирование поддержек для следующих встроенных распределений и пользовательского дистрибутива.
Distribution Значение | Тип распределения |
---|---|
'BirnbaumSaunders' | Бирнбаум-Сондерс |
'Burr' | Подпилите тип XII |
'Exponential' | Экспоненциал |
'Extreme Value' или 'ev' | Экстремум |
'Gamma' | \Gamma |
'InverseGaussian' | Гауссова инверсия |
'Logistic' | Логистический |
'LogLogistic' | Loglogistic |
'LogNormal' | Логарифмически нормальный |
'Nakagami' | Nakagami |
'Normal' | Нормальный |
'Rician' | Rician |
'tLocationScale' | Шкала местоположения t |
'Weibull' или 'wbl' | Weibull |
Для пользовательского дистрибутива необходимо задать распределение при помощи pdf
и cdf
, logpdf
и logsf
, или nloglf
.
mle
игнорирует любой NaN
значения в векторе цензурирования. Кроме того, любой NaN
значения в data
или вектор частоты (Frequency
) причина mle
проигнорировать соответствующие значения в векторе цензурирования.
Пример: 'Censoring',censored
, где censored
вектор, который содержит информацию о цензуре.
Типы данных: логический |
single
| double
TruncationBounds
— Границы усечения[-Inf,Inf]
(значение по умолчанию) | вектор из двух элементовУсечение ограничивает в виде вектора из двух элементов.
mle
поддерживает усеченные наблюдения для следующих встроенных распределений и пользовательского дистрибутива.
Distribution Значение | Тип распределения |
---|---|
'Beta' | \beta |
'BirnbaumSaunders' | Бирнбаум-Сондерс |
'Burr' | Шум |
'Exponential' | Экспоненциал |
'Extreme Value' или 'ev' | Экстремум |
'Gamma' | \Gamma |
'Generalized Extreme Value' или 'gev' | Обобщенный экстремум |
'Generalized Pareto' или 'gp' | Обобщенный Парето |
'Half Normal' или 'hn' | Полунормальный |
'InverseGaussian' | Гауссова инверсия |
'Logistic' | Логистический |
'LogLogistic' | Loglogistic |
'LogNormal' | Логарифмически нормальный |
'Nakagami' | Nakagami |
'Normal' | Нормальный |
'Poisson' | Пуассон |
'Rayleigh' | Рэлеевский |
'Rician' | Rician |
'Stable' | Устойчивый |
'tLocationScale' | Шкала местоположения t |
'Weibull' или 'wbl' | Weibull |
Для пользовательского дистрибутива необходимо задать распределение при помощи pdf
и cdf
, logpdf
и logsf
, или nloglf
.
Пример: 'TruncationBounds',[0,10]
Типы данных: single
| double
Frequency
— Частота наблюденийЧастота наблюдений в виде вектора из неотрицательных целочисленных количеств, который имеет одинаковое число строк как data
. j
элемент th Frequency
значение дает числу раз j
строка th data
наблюдался. Значением по умолчанию является вектор 1 с, указывая на одно наблюдение на строку data
.
mle
игнорирует любой NaN
значения в этом векторе частоты. Кроме того, любой NaN
значения в data
или вектор цензурирования (Censoring
) причина mle
проигнорировать соответствующие значения в векторе частоты.
Пример: 'Frequency',freq
, где freq
вектор, который содержит частоты наблюдения.
Типы данных: single
| double
Alpha
— Уровень значенияУровень значения для доверительного интервала pci
из параметра оценивает в виде скаляра в области значений (0,1). Доверительный уровень pci
100(1–Alpha)
%. Значением по умолчанию является 0.05
для 95%-го доверия.
Пример: 'Alpha',0.01
задает доверительный уровень как 99%.
Типы данных: single
| double
Options
— Опции для итеративного алгоритмаstatset('mlecustom')
(значение по умолчанию) | структураОпции для итеративного алгоритма в виде структуры, возвращенной statset
.
Используйте этот аргумент, чтобы управлять деталями оптимизации наибольшего правдоподобия. Этот аргумент допустим в следующих случаях:
Выборочные данные являются усеченными.
Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.
Вы соответствуете пользовательскому дистрибутиву.
mle
функция интерпретирует следующее statset
опции для оптимизации.
Имя поля | Описание | Значение по умолчанию |
---|---|---|
GradObj | Отметьте указание ли Для примера предоставления градиента к
| 'off' |
DerivStep | Относительная разница в виде вектора одного размера с
| eps^(1/3) |
FunValCheck | Отметьте указание ли Плохой выбор для начальной точки может заставить функции распределения возвращать | 'on' |
TolBnd | Возместите для нижних и верхних границ когда
| 1e-6 |
TolFun | Допуск завершения на значении функции в виде положительной скалярной величины. | 1e-6 |
TolX | Допуск завершения к параметрам в виде положительной скалярной величины. | 1e-6 |
MaxFunEvals | Максимальное количество вычислений функции позволено в виде положительного целого числа. | 400
|
MaxIter | Максимальное количество итераций позволено в виде положительного целого числа. | 200
|
Display | Level of display в виде
| 'off' |
Для примеров Options
аргумент значения имени, смотрите, Находят MLEs для Распределения с Конечной Поддержкой и Распределения Weibull С тремя параметрами.
Для получения дополнительной информации смотрите options
входной параметр fminsearch
и fmincon
(Optimization Toolbox).
Пример: 'Options',statset('FunValCheck','off')
Типы данных: struct
Start
— Начальные значения параметровНачальные значения параметров для распределения Берра, устойчивого распределения и пользовательских дистрибутивов в виде вектора-строки. Длина Start
значение должно совпасть с количеством параметров, оцененных mle
.
Если выборочные данные являются усеченными или включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения, Start
аргумент требуется для Шума и устойчивых распределений. Этот аргумент всегда требуется, когда вы соответствуете пользовательскому дистрибутиву, то есть, когда вы используете pdf
, logpdf
, или nloglf
аргумент значения имени. Для других случаев, mle
может или найти начальные значения или вычислить MLEs без начальных значений.
Пример: 0.05
Пример: [100,2]
Типы данных: single
| double
LowerBound
— Нижние границы для параметров распределения-Inf
s (значение по умолчанию) | вектор-строкаНижние границы для параметров распределения в виде вектора-строки из той же длины как Start
.
Этот аргумент допустим в следующих случаях:
Выборочные данные являются усеченными.
Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.
Вы соответствуете пользовательскому дистрибутиву.
Пример: 'Lowerbound',0
Типы данных: single
| double
UpperBound
— Верхние границы для параметров распределенияInf
s (значение по умолчанию) | вектор-строкаВерхние границы для параметров распределения в виде вектора-строки из той же длины как Start
.
Этот аргумент допустим в следующих случаях:
Выборочные данные являются усеченными.
Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.
Вы соответствуете пользовательскому дистрибутиву.
Пример: 'Upperbound',1
Типы данных: single
| double
OptimFun
— Оптимизационная функция'fminsearch'
(значение по умолчанию) | 'fmincon'
Оптимизационная функция используется mle
использование, чтобы максимизировать вероятность в виде любого 'fminsearch'
или 'fmincon'
. 'fmincon'
опция требует Optimization Toolbox™.
Выборочные данные являются усеченными.
Выборочные данные включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения.
Вы соответствуете пользовательскому дистрибутиву.
Пример: 'Optimfun','fmincon'
phat
— Оценки параметраОценки параметра, возвращенные как вектор-строка. Для описания оценок параметра для встроенных распределений смотрите Distribution
.
pci
— Доверительные интервалы для оценок параметраДоверительные интервалы для оценок параметра, возвращенных как 2 k матрицей, где k является количеством параметров, оцененных mle
. Первые и вторые строки pci
покажите более низкие и верхние пределы достоверности, соответственно.
Можно задать уровень значения для доверительного интервала при помощи Alpha
аргумент значения имени.
mle
поддержки лево-подвергнутые цензуре, подвергнутые цензуре правом, и подвергнутые цензуре интервалом наблюдения.
Лево-подвергнутое цензуре наблюдение во время t
— Событие имело место перед временем t
, и точное время события неизвестно.
Подвергнутое цензуре правом наблюдение во время t
— Событие имело место после времени t
, и точное время события неизвестно.
Подвергнутое цензуре интервалом наблюдение в интервале [t1,t2]
— Событие имело место после времени t1
и перед временем t2
, и точное время события неизвестно.
Дважды подвергнутые цензуре данные включают и лево-подвергнутые цензуре и подвергнутые цензуре правом наблюдения.
Функция выживания является вероятностью выживания в зависимости от времени. Это также вызвано функция оставшегося в живых.
Функция выживания дает вероятность, что время выживания индивидуума превышает определенное значение. Поскольку кумулятивная функция распределения, F (t) является вероятностью, что время выживания меньше чем или равно данной точке t вовремя, функция выживания для непрерывного распределения S (t), является дополнением кумулятивной функции распределения: S (t) = 1 – F (t).
Когда вы предоставляете функции пользовательского дистрибутива или используете встроенные распределения для лево-подвергнутых цензуре, дважды подвергнутых цензуре, подвергнутых цензуре интервалом, или усеченных наблюдений, mle
вычисляет оценки параметра с помощью итеративного алгоритма максимизации. С некоторыми моделями и данными, плохим выбором для начальной точки (Start
) может вызвать mle
сходиться к локальному оптимуму, который не является глобальной переменной maximizer, или не удаваться сходиться полностью. Даже в случаях, для которых логарифмическая правдоподобность хорошего поведения около глобального максимума, выбор начальной точки часто крайне важен для сходимости алгоритма. В частности, если начальные значения параметров далеки от MLEs, потеря значимости в функциях распределения может привести к бесконечной логарифмической правдоподобности.
mle
функция находит MLEs путем минимизации отрицательной функции логарифмической правдоподобности (то есть, максимизации функции логарифмической правдоподобности) или при помощи решения закрытой формы, при наличии. Целевая функция является отрицательным значением логарифма продукта выборочных данных (X) вероятности, учитывая параметры распределения (θ):
Функция вероятности P зависит от информации о цензуре для каждого наблюдения.
Полностью наблюдаемое наблюдение — P (x |θ) = f (x), где f является функцией плотности вероятности (PDF) параметрами θ.
Лево-подвергнутое цензуре наблюдение — P (x |θ) = F (x), где F является кумулятивной функцией распределения (cdf) параметрами θ.
Подвергнутое цензуре правом наблюдение — P (x |θ) = 1 – F (x).
Подвергнутое цензуре интервалом наблюдение между xL и xU — P (x |θ) = F (xU) – F (xL).
Для усеченных данных, mle
масштабирует функции распределения так, чтобы все вероятности легли в границах усечения [L, U].
mle
функция вычисляет доверительные интервалы pci
использование точного метода, когда это доступно, и когда выборочные данные не являются усеченными и не включают лево-подвергнутые цензуре или подвергнутые цензуре интервалом наблюдения. В противном случае функция использует Вальдов метод. Точный метод доступен для этих распределений: бином, дискретная универсальная форма, экспоненциальная, нормальная, логарифмически нормальная, Пуассон, Рэлеевская, и непрерывная универсальная форма.
Указания и ограничения по применению:
Вы не можете задать аргумент Distribution
значения имени как
'Rician'
или 'Stable'
.
Если вы соответствуете пользовательскому дистрибутиву при помощи pdf
и cdf
, logpdf
и logsf
, или nloglf
аргументы name-value, функция пользовательского дистрибутива должна поддержать массивы графического процессора.
Для получения дополнительной информации смотрите функции MATLAB Запуска на графическом процессоре (Parallel Computing Toolbox).
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.