Оценки наибольшего правдоподобия
phat = mle(data)
phat = mle(data,'distribution',dist)
phat = mle(data,'pdf',pdf,'start',start)
phat = mle(data,'pdf',pdf,'start',start,'cdf',cdf)
phat = mle(data,'logpdf',logpdf,'start',start)
phat = mle(data,'logpdf',logpdf,'start',start,'logsf',logsf)
phat = mle(data,'nloglf',nloglf,'start',start)
phat = mle(___,Name,Value)
[phat,pci]
= mle(___)
задает аргументы пары "имя-значение" использования опций в дополнение к любому из входных параметров в предыдущих синтаксисах. Например, можно задать подвергнутые цензуре данные, частоту наблюдений и доверительный уровень.phat
= mle(___,Name,Value
)
Загрузите выборочные данные.
load carbig
Переменная MPG
имеет мили на галлон для различных моделей автомобилей.
Чертите гистограмму данных MPG
.
histogram(MPG)
Распределение несколько правильно скошенный. Симметричное распределение, такое как нормальное распределение, не может быть подходящим вариантом.
Оцените параметры распределения Типа XII Шума для данных MPG
.
phat = mle(MPG,'distribution','burr')
phat = 1×3
34.6447 3.7898 3.5722
Оценки наибольшего правдоподобия для масштабного коэффициента α 34.6447. Оценки для двух параметров формы и из Шума распределение Типа XII 3.7898 и 3.5722, соответственно.
Сгенерируйте выборочные данные размера 1000 от нецентрального распределения хи-квадрат со степенями свободы 8 и параметр нецентрированности 3.
rng default % for reproducibility x = ncx2rnd(8,3,1000,1);
Оцените параметры нецентрального распределения хи-квадрат от выборочных данных. Для этого, пользовательский задают нецентральный хи-квадрат PDF с помощью входного параметра pdf
.
[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,d),'start',[1,1])
phat = 1×2
8.1052 2.6693
pci = 2×2
7.1121 1.6025
9.0983 3.7362
Оценка для степеней свободы 8.1052, и параметр нецентрированности 2.6693. 95%-й доверительный интервал для степеней свободы (7.1121,9.0983), и параметр нецентрированности (1.6025,3.7362). Доверительные интервалы включают истинные значения параметров 8 и 3, соответственно.
Загрузите выборочные данные.
load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));
Данные включают ReadmissionTime
, который имеет времена повторного доступа для 100 пациентов. Вектор-столбец Censored
имеет информацию о цензуре для каждого пациента, где 1 указывает на подвергнутое цензуре наблюдение, и 0, указывает точное время повторного доступа, наблюдается. Это - моделируемые данные.
Задайте пользовательскую плотность вероятности и кумулятивную функцию распределения.
custpdf = @(data,lambda) lambda*exp(-lambda*data); custcdf = @(data,lambda) 1-exp(-lambda*data);
Оцените параметр, lambda
, пользовательского дистрибутива для подвергнутых цензуре выборочных данных.
phat = mle(ReadmissionTime,'pdf',custpdf,'cdf',custcdf,'start',0.05,'Censoring',Censored)
phat = 0.1096
Загрузите выборочные данные.
load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));
Данные включают ReadmissionTime
, который имеет времена повторного доступа для 100 пациентов. Вектор-столбец Censored
имеет информацию о цензуре для каждого пациента, где 1 указывает на подвергнутое цензуре наблюдение, и 0, указывает точное время повторного доступа, наблюдается. Это - моделируемые данные.
Задайте пользовательскую логарифмическую плотность вероятности и функцию выживания.
custlogpdf = @(data,lambda,k) log(k)-k*log(lambda)+(k-1)*log(data)-(data/lambda).^k; custlogsf = @(data,lambda,k) -(data/lambda).^k;
Оцените параметры, lambda
и k
, пользовательского дистрибутива для подвергнутых цензуре выборочных данных.
phat = mle(ReadmissionTime,'logpdf',custlogpdf,'logsf',custlogsf,... 'start',[1,0.75],'Censoring',Censored)
phat = 1×2
9.2090 1.4223
Шкала и параметры формы пользовательски заданного распределения 9.2090 и 1.4223, соответственно.
Загрузите выборочные данные.
load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));
Данные включают ReadmissionTime
, который имеет времена повторного доступа для 100 пациентов. Это - моделируемые данные.
Задайте отрицательную логарифмическую функцию правдоподобия.
custnloglf = @(lambda,data,cens,freq) - length(data)*log(lambda) + nansum(lambda*data);
Оцените параметры заданного распределения.
phat = mle(ReadmissionTime,'nloglf',custnloglf,'start',0.05)
phat = 0.1462
Сгенерируйте 100 случайных наблюдений от биномиального распределения с количеством испытаний, = 20, и вероятность успеха, = 0.75.
data = binornd(20,0.75,100,1);
Оцените вероятность успеха и 95%-х пределов достоверности с помощью моделируемых выборочных данных.
[phat,pci] = mle(data,'distribution','binomial','alpha',.05,'ntrials',20)
phat = 0.7615
pci = 2×1
0.7422
0.7800
Оценка вероятности успеха 0.7615, и нижние и верхние пределы 95%-го доверительного интервала 0.7422 и 0.78. Этот интервал покрывает истинное значение, используемое, чтобы моделировать данные.
Сгенерируйте выборочные данные размера 1000 от нецентрального распределения хи-квадрат со степенями свободы 10 и параметр нецентрированности 5.
rng default % for reproducibility x = ncx2rnd(10,5,1000,1);
Предположим, что параметр нецентрированности фиксируется в значении 5. Оцените степени свободы нецентрального распределения хи-квадрат от выборочных данных. Для этого, пользовательский задают нецентральный хи-квадрат PDF с помощью входного параметра pdf
.
[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,5),'start',1)
phat = 9.9307
pci = 2×1
9.5626
10.2989
Оценка для параметра нецентрированности 9.9307 с 95%-м доверительным интервалом 9,5626 и 10.2989. Доверительный интервал включает истинное значение параметров 10.
Сгенерируйте выборочные данные размера 1000 от распределения Rician с параметром нецентрированности 8 и масштабным коэффициентом 5. Сначала создайте распределение Rician.
r = makedist('Rician','s',8,'sigma',5);
Теперь, сгенерируйте выборочные данные от распределения, которое вы создали выше.
rng default % For reproducibility x = random(r,1000,1);
Предположим, что масштабный коэффициент известен, и оцените параметр нецентрированности от выборочных данных. Чтобы сделать это использование mle
, вы должны пользовательский задавать функцию плотности вероятности Rician.
[phat,pci] = mle(x,'pdf',@(x,s,sigma) pdf('rician',x,s,5),'start',10)
phat = 7.8953
pci = 2×1
7.5405
8.2501
Оценка для параметра нецентрированности 7.8953 с 95%-м доверительным интервалом 7,5404 и 8.2501. Доверительный интервал включает истинное значение параметров 8.
Добавьте масштабный коэффициент в распределение хи-квадрат для адаптации к шкале данных и соответствуйте ему. Во-первых, сгенерируйте выборочные данные размера 1000 от распределения хи-квадрат со степенями свободы 5 и масштабируйте его фактором 100.
rng default % For reproducibility x = 100*chi2rnd(5,1000,1);
Оцените степени свободы и масштабный коэффициент. Для этого, пользовательский задают функцию плотности вероятности хи-квадрата с помощью входного параметра pdf
. Функция плотности требует a фактор для данных, масштабируемых .
[phat,pci] = mle(x,'pdf',@(x,v,s)chi2pdf(x/s,v)/s,'start',[1,200])
phat = 1×2
5.1079 99.1681
pci = 2×2
4.6862 90.1215
5.5297 108.2146
Оценка для степеней свободы 5.1079, и шкала 99.1681. 95%-й доверительный интервал для степеней свободы (4.6862,5.5279), и масштабный коэффициент (90.1215,108.2146). Доверительные интервалы включают истинные значения параметров 5 и 100, соответственно.
данные
Выборочные данныеВыборочные данные использование mle
, чтобы оценить параметры распределения, заданные как вектор.
Типы данных: single | double
dist
Тип распределения'normal'
(значение по умолчанию) | вектор символов или скаляр строки типа распределенияТип распределения, чтобы оценить параметры для, заданный как одно из следующих.
dist | Описание | Параметр 1 | Параметр 2 | Параметр 3 | Параметр 4 |
---|---|---|---|---|---|
'Bernoulli' | Бернуллиевое распределение | p: вероятность успеха для каждого испытания | — | — | — |
'Beta' | Бета распределение | a: сначала сформируйте параметр | b: второй параметр формы | — | — |
'bino' или 'Binomial' | Биномиальное распределение | n: количество испытаний | p: вероятность успеха для каждого испытания | — | — |
'BirnbaumSaunders' | Распределение Бирнбаума-Сондерса | β: масштабный коэффициент | γ: сформируйте параметр | — | — |
'Burr' | Подпилите распределение типа XII | α: масштабный коэффициент | c: сначала сформируйте параметр | k: второй параметр формы | — |
'Discrete Uniform' или 'unid' | (Дискретное) равномерное распределение | n: максимальное заметное значение | — | — | — |
'exp' или 'Exponential' | Экспоненциальное распределение | μ: среднее значение | — | — | — |
'ev' или 'Extreme Value' | Распределение экстремума | μ: параметр положения | σ: масштабный коэффициент | — | — |
'gam' или 'Gamma' | Гамма распределение | a: сформируйте параметр | b: масштабный коэффициент | — | — |
'gev' или 'Generalized Extreme Value' | Обобщенное распределение экстремума | k: сформируйте параметр | σ: масштабный коэффициент | μ: параметр положения | — |
'gp' или 'Generalized Pareto' | Обобщенное распределение Парето | k: индекс хвоста (форма) параметр | σ: масштабный коэффициент | θ: порог (местоположение) параметр | — |
'geo' или 'Geometric' | Геометрическое распределение | p: параметр вероятности | — | — | — |
'hn' или 'Half Normal' | Полунормальное распределение | μ: параметр положения | σ: масштабный коэффициент | — | — |
'InverseGaussian' | Обратное распределение Гаусса | μ: масштабный коэффициент | λ: сформируйте параметр | — | — |
'Logistic' | Логистическое распределение | μ: среднее значение | σ: масштабный коэффициент | — | — |
'LogLogistic' | Распределение Loglogistic | μ: среднее значение логарифмических значений | σ: масштабный коэффициент логарифмических значений | — | — |
'logn' или 'LogNormal' | Логарифмически нормальное распределение | μ: среднее значение логарифмических значений | σ: стандартное отклонение логарифмических значений | — | — |
'Nakagami' | Распределение Nakagami | μ: сформируйте параметр | ω: масштабный коэффициент | — | — |
'nbin' или 'Negative Binomial' | Отрицательное биномиальное распределение | r: количество успехов | p: вероятность успеха в одном испытании | — | — |
'norm' или 'Normal' | Нормальное распределение | μ: среднее значение | σ: стандартное отклонение | — | — |
'poiss' или 'Poisson' | Распределение Пуассона | λ: среднее значение | — | — | — |
'rayl' или 'Rayleigh' | Распределение Релея | b: масштабный коэффициент | — | — | — |
'Rician' | Распределение Rician | s: параметр нецентрированности | σ: масштабный коэффициент | — | — |
'Stable' | Стабильное распределение | α: сначала сформируйте параметр | β: второй параметр формы | γ: масштабный коэффициент | δ: параметр положения |
'tLocationScale' | t Распределение Шкалы Местоположения | μ: параметр положения | σ: масштабный коэффициент | ν: сформируйте параметр | — |
'unif' или 'Uniform' | (Непрерывное) равномерное распределение | a: более низкая конечная точка (минимум) | b: верхняя конечная точка (максимум) | — | — |
'wbl' или 'Weibull' | Распределение Weibull | a: масштабный коэффициент | b: сформируйте параметр | — | — |
Пример: 'rician'
pdf
— Пользовательская функция плотности вероятностиПользовательская функция распределения вероятностей, заданная как указатель на функцию, созданный с помощью @
.
Эта пользовательская функция принимает векторный data
и один или несколько отдельных параметров распределения как входные параметры, и возвращает вектор значений плотности вероятности.
Например, если именем пользовательской функции плотности вероятности является newpdf
, то можно задать указатель на функцию в mle
можно следующим образом.
Пример: @newpdf
Типы данных: function_handle
cdf
— Пользовательская кумулятивная функция распределенияПользовательская кумулятивная функция распределения, заданная как указатель на функцию, созданный с помощью @
.
Эта пользовательская функция принимает векторный data
и один или несколько отдельных параметров распределения как входные параметры, и возвращает вектор значений интегральной вероятности.
Необходимо задать cdf
с pdf
, если данные подвергаются цензуре, и вы используете аргумент пары "имя-значение" 'Censoring'
. Если 'Censoring'
не присутствует, вы не должны задавать cdf
при использовании pdf
.
Например, если именем пользовательской кумулятивной функции распределения является newcdf
, то можно задать указатель на функцию в mle
можно следующим образом.
Пример: @newcdf
Типы данных: function_handle
logpdf
— Пользовательская логарифмическая функция плотности вероятностиПользовательская логарифмическая функция плотности вероятности, заданная как указатель на функцию, созданный с помощью @
.
Эта пользовательская функция принимает векторный data
и один или несколько отдельных параметров распределения как входные параметры, и возвращает вектор логарифмических значений вероятности.
Например, если именем пользовательской логарифмической функции плотности вероятности является customlogpdf
, то можно задать указатель на функцию в mle
можно следующим образом.
Пример: @customlogpdf
Типы данных: function_handle
logsf
— Пользовательская логарифмическая функция выживанияПользовательская логарифмическая функция выживания, заданная как указатель на функцию, созданный с помощью @
.
Эта пользовательская функция принимает векторный data
и один или несколько отдельных параметров распределения как входные параметры, и возвращает вектор логарифмических значений вероятности выживания.
Необходимо задать logsf
с logpdf
, если данные подвергаются цензуре, и вы используете аргумент пары "имя-значение" 'Censoring'
. Если 'Censoring'
не присутствует, вы не должны задавать logsf
при использовании logpdf
.
Например, если именем пользовательской логарифмической функции выживания является logsurvival
, то можно задать указатель на функцию в mle
можно следующим образом.
Пример: @logsurvival
Типы данных: function_handle
nloglf
— Пользовательская отрицательная функция loglikelihoodПользовательская отрицательная функция loglikelihood, заданная как указатель на функцию, созданный с помощью @
.
Эта пользовательская функция принимает следующие входные параметры.
params | Вектор значений параметра распределения. mle обнаруживает количество параметров от числа элементов в start . |
data | Вектор данных. |
cens | Булев вектор подвергнутых цензуре значений. |
freq | Вектор частот целочисленных данных. |
nloglf
должен принять все четыре аргумента, даже если вы не используете аргументы пары "имя-значение" 'Censoring'
или 'Frequency'
. Можно записать 'nloglf'
, чтобы проигнорировать аргументы cens
и freq
в этом случае.
nloglf
возвращает скалярное отрицательное loglikelihood значение и опционально, отрицательный loglikelihood вектор градиента (см. поле 'GradObj'
в 'Options'
).
Если именем пользовательской отрицательной логарифмической функции правдоподобия является negloglik
, то можно задать указатель на функцию в mle
можно следующим образом.
Пример: @negloglik
Типы данных: function_handle
запуск
Начальные значения параметровНачальные значения параметров для пользовательских функций, заданных как скалярное значение или вектор скалярных значений.
Используйте start
, когда вы соответствуете пользовательским дистрибутивам, то есть, когда вы используете pdf
и cdf
, logpdf
и logsf
или входные параметры nloglf
.
Пример: 0.05
Пример: [100,2]
Типы данных: single | double
Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми.
Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение.
Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.
'Censoring',Cens,'Alpha',0.01,'Options',Opt
указывает, что mle
оценивает параметры для распределения подвергнутых цензуре данных, заданных массивом Cens
, вычисляет 99% пределов достоверности для оценок параметра и использует параметры управления алгоритмом, заданные структурой Opt
.'Censoring'
— Индикатор для цензурированияИндикатор для цензурирования, заданный как пара, разделенная запятой, состоящая из 'Censoring'
и булева массива, одного размера как data
. Используйте 1 для наблюдений, которые являются правильные подвергнутый цензуре и 0 для наблюдений, которые полностью наблюдаются. Значением по умолчанию являются все наблюдения, полностью наблюдаются.
Например, если подвергнутая цензуре информация о данных находится в двоичном массиве под названием Censored
, то можно задать подвергнутые цензуре данные можно следующим образом.
Пример: 'Censoring',Censored
Цензурирование поддержек mle
для следующих дистрибутивов:
Бирнбаум-Сондерс Шум Экспоненциал Экстремум \Gamma Гауссова инверсия Ядро Логистический журналом | Логистический Логарифмически нормальный Nakagami Нормальный Rician t Шкала Местоположения Weibull |
Типы данных: логический
'Frequency'
— Частота наблюденийЧастота наблюдений, заданных как пара, разделенная запятой, состоящая из 'Frequency'
и массива, содержащего неотрицательные целочисленные количества, который одного размера как data
. Значением по умолчанию является одно наблюдение на элемент data
.
Например, если частоты наблюдения хранятся в массиве под названием Freq
, можно задать частоты можно следующим образом.
Пример: 'Frequency',Freq
Типы данных: single | double
\alpha
Уровень значенияУровень значения для доверительного интервала оценок параметра, pci
, заданного как пара, разделенная запятой, состоящая из 'Alpha'
и скалярного значения в области значений (0,1). Доверительный уровень pci
является % 100(1-Alpha)
. Значением по умолчанию является 0.05
для 95%-й уверенности.
Например, для 99% пределов достоверности, можно задать доверительный уровень можно следующим образом.
Пример: 'Alpha',0.01
Типы данных: single | double
'NTrials'
— Количество испытанийКоличество испытаний за соответствующий элемент data
, заданного как пара, разделенная запятой, состоящая из 'Ntrials'
и скаляра или вектора, одного размера как data
.
Применяется только к биномиальному распределению.
Пример: 'Ntrials',total
Типы данных: single | double
\mu
Параметр положенияПараметр положения для полунормального распределения, заданного как пара, разделенная запятой, состоящая из 'mu'
и скалярного значения.
Применяется только к полунормальному распределению.
Пример: 'mu',1
Типы данных: single | double
Опции
Параметры управления алгоритмом подбораПараметры управления алгоритмом подбора, заданные как пара, разделенная запятой, состоящая из 'Options'
и структуры, возвращенной statset
.
Не применимый ко всем дистрибутивам.
Используйте аргумент пары "имя-значение" 'Options'
, чтобы управлять деталями оптимизации наибольшего правдоподобия при подборе кривой пользовательскому дистрибутиву. Для названий параметра и значений по умолчанию, введите statset('mlecustom')
. Можно установить опции под новым именем и использованием это в аргументе пары "имя-значение". mle
интерпретирует следующие параметры statset
для подбора кривой пользовательского дистрибутива.
Параметр | Значение |
---|---|
'GradObj' | Значением по умолчанию является
|
'DerivStep' | Значением по умолчанию является Относительной разницей, заданной как скаляр или вектор тот же размер как
|
'FunValCheck' | Значением по умолчанию является
Плохой выбор отправной точки может иногда заставлять эти функции возвращать |
'TolBnd' |
Значением по умолчанию является Смещение для нижних и верхних границ при использовании
|
Пример: 'Options',statset('mlecustom')
Типы данных: struct
'LowerBound'
— Нижние границы для параметров распределенияНижние границы для параметров распределения, заданных как пара, разделенная запятой, состоящая из 'Lowerbound'
и вектора тот же размер как start
.
Этот аргумент пары "имя-значение" допустим только, когда вы используете pdf
и cdf
, logpdf
и logcdf
или входные параметры nloglf
.
Пример: 'Lowerbound',0
Типы данных: single | double
'UpperBound'
— Верхние границы для параметров распределенияВерхние границы для параметров распределения, заданных как пара, разделенная запятой, состоящая из 'Upperbound'
и вектора тот же размер как start
.
Этот аргумент пары "имя-значение" допустим только, когда вы используете pdf
и cdf
, logpdf
и logsf
или входные параметры nloglf
.
Пример: 'Upperbound',1
Типы данных: single | double
'OptimFun'
— Функция оптимизации'fminsearch'
(значение по умолчанию) | 'fmincon'
Функция оптимизации mle
использует в максимизации вероятности, заданной как пара, разделенная запятой, состоящая из 'Optimfun'
и или 'fminsearch'
или 'fmincon'
.
Значением по умолчанию является 'fminsearch'
.
Можно только задать 'fmincon'
, если Optimization Toolbox™ доступен.
Аргумент пары "имя-значение" 'Optimfun'
допустим только, когда вы соответствуете пользовательским дистрибутивам, то есть, когда вы используете pdf
и cdf
, logpdf
и logsf
или входные параметры nloglf
.
Пример: 'Optimfun','fmincon'
phat
— Оценки параметраОценки параметра, возвращенные как скалярное значение или вектор - строка.
pci
— Доверительные интервалы для оценок параметраДоверительные интервалы для оценок параметра, возвращенных как вектор-столбец или матрица в зависимости от количества параметров, следовательно размер phat
.
pci
является 2 k матрицей, где k является количеством параметров оценки mle
. Первые и вторые строки pci
показывают более низкие и верхние пределы достоверности, соответственно.
Функция выживания является вероятностью выживания как функция времени. Это также вызвано функция оставшегося в живых. Это дает вероятность, что время выживания человека превышает определенное значение. Поскольку кумулятивная функция распределения, F (t), является вероятностью, что время выживания меньше чем или равно данному моменту времени, функция выживания для непрерывного распределения, S (t), является дополнением кумулятивной функции распределения: S (t) = 1 – F (t).
Когда вы предоставляете функции распределения, mle
вычисляет оценки параметра с помощью итеративного алгоритма максимизации. С некоторыми моделями и данными, плохой выбор отправной точки может заставить mle
сходиться к локальному оптимуму, который не является глобальной переменной maximizer, или не удаваться сходиться полностью. Даже в случаях, для которых логарифмическая вероятность хорошего поведения около глобального максимума, выбор отправной точки часто крайне важен для сходимости алгоритма. В частности, если начальные значения параметров далеки от MLEs, потеря значимости в функциях распределения может привести к бесконечным логарифмическим вероятностям.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.