Распределение типа XII Берра является семейством распределений с тремя параметрами на положительной действительной линии. Кумулятивная функция распределения (cdf) распределения Берра
где c и k являются параметрами формы, и α является масштабным коэффициентом. Функция плотности вероятности (PDF)
Плотность распределения типа XII Берра является L-образной если c ≤ 1 и одномодовый в противном случае.
Распределение Берра было сначала обсуждено Берром (1942) как семейство 2D параметров. Дополнительный масштабный коэффициент был введен Tadikamalla (1980). Это - гибкое семейство распределений, которое может описать широкий спектр форм распределения. Распределение Берра включает, перекрывает или имеет как ограничивающий случай, много обычно используемых распределений, таких как гамма, логарифмически нормальная, loglogistic, колоколообразные, и J-образные бета распределения (но не U-образное). Некоторые составные распределения также соответствуют распределению Берра. Например, соединение распределения Вейбалла с гамма распределением для его масштабного коэффициента приводит к распределению Берра. Точно так же соединение экспоненциального распределения с гамма распределением для его параметра уровня, 1/μ, также дает к распределению Берра. Распределение Берра также имеет два асимптотических ограничивающих случая: Вейбалл и Тип I Парето.
Распределение Берра может соответствовать широкому спектру эмпирических данных. Различные значения его параметров покрывают широкий набор скошенности и эксцесса. Следовательно, это используется в различных полях, таких как финансы, гидрология и надежность, чтобы смоделировать множество типов данных. Примеры данных, смоделированных распределением Берра, являются доходом семьи, обрезают цены, страховой риск, время прохождения, лавинно рассылают уровни и данные об отказе.
Выживание и функции опасности распределения типа XII Берра, соответственно,
и
Если c> 1, функция опасности h (x) является немонотонной с режимом в x = α (c – 1)1/c.
Распределение Берра с тремя параметрами задано его масштабным коэффициентом α и параметры формы c и k. Можно оценить параметры с помощью mle
или fitdist
. Обе функции поддерживают подвергнутые цензуре данные для распределения Берра.
Сгенерируйте выборочные данные от распределения Берра с масштабным коэффициентом 0.5 и сформируйте параметры 2 и 5.
rng('default') R = random('burr',0.5,2,5,1000,1);
Оцените параметры и доверительные интервалы.
[phat,pci] = mle(R,'distribution','burr')
phat = 0.4154 2.1217 4.0550 pci = 0.2985 1.9560 2.4079 0.5782 2.3014 6.8288
Распределение Берра с тремя параметрами сходится асимптотически к одной из двух ограничивающих форм, когда его параметры отличаются:
Если k →0, c →∞, ck = λ, то распределение Берра уменьшает до 2D параметра распределение Парето с cdf
Если k →∞, α →∞, α/k1/c = θ, затем распределение Берра уменьшает до 2D параметра распределение Weibull с cdf
Если mle
или fitdist
обнаруживает такое расхождение, оно возвращает сообщение об ошибке, но сообщает вам об ограничивающем распределении и соответствующих оценках параметра для того распределения.
В этом примере показано, как соответствовать распределению Берра к данным, чертите cdf и создайте гистограмму с подгонкой распределения Берра.
1. Загрузите выборочные данные.
load arrhythmia
Пятая колонна в X
содержит измерение, полученное из электрокардиограмм, названных длительностью QRS.
2. Соответствуйте распределению Шума к данным о длительности QRS и получите оценки параметра.
PD = fitdist(X(:,5),'burr');
PD
имеет оценки наибольшего правдоподобия параметров распределения Берра в свойстве Param
. Оценки являются α = 80.4515, = 18.9251, = 0.4492.
3. Постройте cdf данных о длительности QRS.
QRScdf=cdf('burr',sortrows(X(:,5)),80.4515,18.9251,0.4492); plot(sortrows(X(:,5)),QRScdf) title('QRS duration data') xlabel('QRS Duration')
4. Чертите гистограмму данных о длительности QRS с 15 интервалами и PDF подгонки распределения Берра.
histfit(X(:,5),15,'burr') title('Histogram of QRS data with a Burr distribution fit') xlabel('QRS Duration')
Сравните логарифмически нормальную PDF с доходными данными об использовании PDF Берра, сгенерированными от логарифмически нормального распределения.
Сгенерируйте доходные данные.
rng('default') % For reproducibility y = random('Lognormal',log(25000),0.65,[500,1]);
Соответствуйте распределению Шума.
pd = fitdist(y,'burr')
pd = BurrDistribution Burr distribution alpha = 26007.2 [21165.5, 31956.4] c = 2.63743 [2.3053, 3.0174] k = 1.09658 [0.775479, 1.55064]
Постройте и Шум и логарифмически нормальный pdfs поступивших данных по той же фигуре.
p_burr = pdf(pd,sortrows(y)); p_lognormal = pdf('Lognormal',sortrows(y),log(25000),0.65); plot(sortrows(y),p_burr,'-',sortrows(y),p_lognormal,'-.') title('Burr and Lognormal pdfs Fit to Income Data') legend('Burr Distribution','Lognormal Distribution')
В этом примере показано, как создать множество форм для функций плотности вероятности распределения Берра.
X = 0:0.01:5; c = [0.5 0.95 2 5]; k = [0.5 0.75 2 5]; alpha = [0.5 1 2 5]; colors = ['b';'g';'r';'k']'; figure for i = 1:1:4 pdf1(i,:) = pdf('burr',X,1,c(i),0.5); pdf2(i,:) = pdf('burr',X,1,2,k(i)); pdf3(i,:) = pdf('burr',X,alpha(i),2,0.5); axC = subplot(3,1,1); pC(i) = plot(X,pdf1(i,:),colors(i),'LineWidth',2); title('Effect of c, \alpha = 1, k = 0.5'),xlabel('x') hold on axK = subplot(3,1,2); pK(i) = plot(X,pdf2(i,:),colors(i),'LineWidth',2); title('Effect of k, \alpha = 1, c = 2'),xlabel('x') hold on axAlpha = subplot(3,1,3); pAlpha(i) = plot(X,pdf3(i,:),colors(i),'LineWidth',2); title('Effect of \alpha, c = 2, k = 0.5'),xlabel('x') hold on end set(axC,'XLim',[0 3],'YLim',[0 1.2]); set(axK,'XLim',[0 3],'YLim',[0 2.1]); set(axAlpha,'XLim',[0 5],'YLim',[0 1]); legend(axC,'c=0.5','c=0.95','c=2','c=5'); legend(axK,'k=0.5','k=0.75','k=2','k=5'); legend(axAlpha,'\alpha=0.5','\alpha=1','\alpha=2','\alpha=5');
Этот рисунок иллюстрирует, как форма и шкала распределения Берра изменяются для различных значений его параметров.
В этом примере показано, как найти и построить выживание, и опасность функционирует для выборки, прибывающей из распределения Берра.
Сгенерируйте данные.
X = 0:0.015:2.5;
Оцените PDF и cdf данных в X
.
Xpdf = pdf('burr',X,0.2,5,0.5); Xcdf = cdf('burr',X,0.2,5,0.5);
Оцените и постройте функцию выживания данных в X
.
S = 1.-Xcdf; % survival function plot(X,S,'LineWidth',2) title('Survival function') xlabel('x')
Оцените и постройте функцию опасности данных в X
.
H = Xpdf./S; % hazard function plot(X,H,'r','LineWidth',2) title('Hazard function') xlabel('x')
В этом примере показано, как интерпретировать отображение, когда оценки параметра отличаются при подборе кривой распределению Берра к входным данным.
1. Сгенерируйте выборочные данные от распределения Weibull параметрами 0.5 и 2.
rng('default') % for reproducibility X = wblrnd(0.5,2,100,1);
2. Соответствуйте распределению Шума.
PD = fitdist(X,'burr');
Error using addburr>burrfit (line 566) The data are not fit by a Burr distribution with finite parameters. The maximum likelihood fit is provided by the k->Inf, alpha->Inf limiting form of the Burr distribution: a Weibull distribution with the parameters below. a (scale): 0.476817 b (shape): 1.96219 Error in prob.BurrDistribution.fit (line 246) p = burrfit(x,0.05,cens,freq,opt); Error in fitdist>localfit (line 238) pd = feval(fitter,x,'cens',c,'freq',f,varargin{:}); Error in fitdist (line 185) pd = localfit(dist,fitter,x,cens,freq,args{:});
Сообщение об ошибке говорит вам, что семейство Weibull, кажется, соответствует данным лучше и дает вам оценки параметра от подгонки Weibull. Можно использовать те оценки непосредственно. Если вам нужны оценки ковариации для параметров или другой информации о подгонке, можно переоборудовать распределение Weibull к данным.
3. Соответствуйте распределению Weibull к данным и найдите доверительные интервалы для оценок параметра.
PD = fitdist(X,'weibull');
paramci(PD)
ans = 0.4291 1.6821 0.5298 2.2890
Это 95% доверительных интервалов оценок параметра для подгонки распределения Weibull.
[1] Шипите, Ирвинг В. “Совокупные функции частоты”. Летопись Математической Статистики, Издания 13, Номера 2, 1942, стр 215–232.
[2] Tadikamalla, Пэнду Р. “Взгляд на Шум и связанные распределения”. Международный Статистический Анализ, Издание 48, Номер 3, 1980, стр 337–344.
[3] Родригес, Роберт Н. “Руководство по распределениям типа XII Берра”. Biometrika, Издание 64, Номер 1, 1977, стр 129–134.
[4] AL-Hussaini, Эссам К. “Характеристика распределения типа XII Берра”. Прикладная Математика. Латыш. Издание 4, Номер 1, 1991, стр 59–61.
[5] Grammig, Джоаким и Kai-Oliver Маурер. “Немонотонная опасность функционирует и авторегрессивная условная модель длительности”. Журнал эконометрики, Издание 3, 2000, стр 16–38.