Распределение Burr Type XII

Определение

Распределение Burr type XII является трехпараметрическим семейством распределений на положительной вещественной линии. Кумулятивная функция распределения (cdf) распределения Burr

F(x|α,c,k)=11(1+(xα)c)k,x>0,α>0,c>0,k>0,

где c и k являются параметрами формы, а α - параметром шкалы. Функция плотности вероятностей (pdf) является

f(x|α,c,k)=kcα(xα)c1(1+(xα)c)k+1,x>0,α>0,c>0,k>0.

Плотность распределения Burr типа XII L-образна, если c ≤ 1 и унимодальная, в противном случае.

Фон

Распределение Берра впервые обсуждалось Берром (1942) как двухпараметрическое семейство. Дополнительный параметр шкалы был введен Tadikamalla (1980). Это гибкое семейство распределений, которое может выражать широкую область значений форм распределения. Распределение Burr включает, перекрывает или имеет как ограничивающий случай многие обычно используемые распределения, такие как гамма, lognormal, loglogistic, bell-образные и J-образные бета-распределения (но не U-образные). Некоторые распределения соединений также соответствуют распределению Burr. Для примера составление распределения Вейбула с гамма-распределением для его шкалы параметра результатов в распределении Бёрра. Аналогично, компаундирование экспоненциального распределения с гамма-распределением для его параметра скорости 1/мкм также приводит к распределению Burr. Распределение Burr также имеет два асимптотических случая ограничения: Weibull и Pareto Type I.

Распределение Burr может соответствовать широкой области значений эмпирических данных. Различные значения его параметров охватывают широкий набор перекосов и куртозов. Следовательно, он используется в различных областях, таких как финансы, гидрология и надежность, для моделирования различных типов данных. Примерами данных, моделируемых распределением Burr, являются доход домохозяйства, цены на урожай, страховой риск, время в пути, уровни наводнения и данные о отказах.

Функции выживания и опасности распределения Burr типа XII, соответственно,

S(x|α,c,k)=1[1+(xα)c]k

и

h(x|α,c,k)=kcα(xα)c11+(xα)c.

Если c > 1, опасная функция h (x) немонотонна с режимом при x = α (c - 1)1/c.

Параметры

Трехпараметровое распределение Берра определяется его параметром шкалы α и параметрами формы c и k. Оценить параметры можно используя mle или fitdist. Обе функции поддерживают цензурные данные для распределения Burr.

Сгенерируйте выборочные данные из распределения Burr с параметром шкалы 0,5 и параметрами формы 2 и 5.

rng('default')
R = random('burr',0.5,2,5,1000,1);

Оцените параметры и доверительные интервалы.

[phat,pci] = mle(R,'distribution','burr')
phat =

    0.4154    2.1217    4.0550


pci =

    0.2985    1.9560    2.4079
    0.5782    2.3014    6.8288
Интервалы доверия по умолчанию 95% для параметров включают истинные значения параметров.

Трехпараметровое распределение Берра сходится асимптотически к одной из двух ограничивающих форм, когда его параметры расходятся:

  • Если k − 0, c − , ck =, то распределение Burr сводится к двухпараметрическому распределению Парето с cdf

    FP=1(xα)λ,xα.

  • Если k − ∞, α→∞, α/ k1/c =, затем распределение Burr сводится к двухпараметрическому распределению Вейбула с cdf

    FW(x|c,θ)=1exp[(xθ)c].

Если mle или fitdist обнаруживает такое расхождение, оно возвращает сообщение об ошибке, но сообщает вам об ограничивающем распределении и соответствующих оценках параметра для этого распределения.

Подбор распределения Burr и построение cdf

В этом примере показано, как подогнать распределение Burr к данным, нарисовать cdf и создать гистограмму с подгонкой распределения Burr.

1. Загрузите выборочные данные.

load arrhythmia

Пятый столбец в X содержит измерение, полученное из электрокардиограмм, называемое длительностью QRS.

2. Подбор распределения Burr к данным длительности QRS и получение оценок параметров.

PD = fitdist(X(:,5),'burr');

PD имеет максимальные оценки вероятности параметров распределения Burr в свойстве Param. Оценки α = 80,4515, c = 18.9251, k = 0.4492.

3. Постройте график cdf данных длительности QRS.

QRScdf=cdf('burr',sortrows(X(:,5)),80.4515,18.9251,0.4492);
plot(sortrows(X(:,5)),QRScdf) 
title('QRS duration data')
xlabel('QRS Duration')

Figure contains an axes. The axes with title QRS duration data contains an object of type line.

4. Нарисуйте гистограмму данной длительности QRS с 15 интервалами и PDF распределительной подгонки Burr.

histfit(X(:,5),15,'burr')
title('Histogram of QRS data with a Burr distribution fit')
xlabel('QRS Duration')

Figure contains an axes. The axes with title Histogram of QRS data with a Burr distribution fit contains 2 objects of type bar, line.

Сравнение Lognormal и Burr Distribution PDFS

Сравните lognormal PDF с Burr PDF, используя данные о доходах, полученные из lognormal распределения.

Сгенерируйте данные о доходах.

rng('default') % For reproducibility
y = random('Lognormal',log(25000),0.65,[500,1]);

Подбор распределения Burr.

pd = fitdist(y,'burr')
pd = 
  BurrDistribution

  Burr distribution
    alpha = 26007.2   [21165.5, 31956.4]
        c = 2.63743   [2.3053, 3.0174]
        k = 1.09658   [0.775479, 1.55064]

Постройте графики как Burr, так и lognormal PDFS данных о доходах на одном и том же рисунке.

p_burr = pdf(pd,sortrows(y));
p_lognormal = pdf('Lognormal',sortrows(y),log(25000),0.65);
plot(sortrows(y),p_burr,'-',sortrows(y),p_lognormal,'-.')
title('Burr and Lognormal pdfs Fit to Income Data')
legend('Burr Distribution','Lognormal Distribution')

Figure contains an axes. The axes with title Burr and Lognormal pdfs Fit to Income Data contains 2 objects of type line. These objects represent Burr Distribution, Lognormal Distribution.

Burr pdf для различных параметров

Этот пример показывает, как создать множество форм для функций плотности вероятностей распределения Burr.

X = 0:0.01:5;
c = [0.5 0.95 2 5];
k = [0.5 0.75 2 5];
alpha = [0.5 1 2 5];
colors = ['b';'g';'r';'k']';

figure
for i = 1:1:4
pdf1(i,:) = pdf('burr',X,1,c(i),0.5);
pdf2(i,:) = pdf('burr',X,1,2,k(i));
pdf3(i,:) = pdf('burr',X,alpha(i),2,0.5); 

axC = subplot(3,1,1);
pC(i) = plot(X,pdf1(i,:),colors(i),'LineWidth',2);
title('Effect of c, \alpha = 1, k = 0.5'),xlabel('x') 
hold on
 
axK = subplot(3,1,2);
pK(i) = plot(X,pdf2(i,:),colors(i),'LineWidth',2);
title('Effect of k, \alpha = 1, c = 2'),xlabel('x') 
hold on 

axAlpha = subplot(3,1,3);
pAlpha(i) = plot(X,pdf3(i,:),colors(i),'LineWidth',2);
title('Effect of \alpha, c = 2, k = 0.5'),xlabel('x') 
hold on
end

set(axC,'XLim',[0 3],'YLim',[0 1.2]);
set(axK,'XLim',[0 3],'YLim',[0 2.1]);
set(axAlpha,'XLim',[0 5],'YLim',[0 1]);

legend(axC,'c=0.5','c=0.95','c=2','c=5');
legend(axK,'k=0.5','k=0.75','k=2','k=5');
legend(axAlpha,'\alpha=0.5','\alpha=1','\alpha=2','\alpha=5');

Figure contains 3 axes. Axes 1 with title Effect of c, \alpha = 1, k = 0.5 contains 4 objects of type line. These objects represent c=0.5, c=0.95, c=2, c=5. Axes 2 with title Effect of k, \alpha = 1, c = 2 contains 4 objects of type line. These objects represent k=0.5, k=0.75, k=2, k=5. Axes 3 with title Effect of \alpha, c = 2, k = 0.5 contains 4 objects of type line. These objects represent \alpha=0.5, \alpha=1, \alpha=2, \alpha=5.

Этот рисунок иллюстрирует, как форма и шкала распределения Burr изменяются для различных значений его параметров.

Функции выживания и опасности при распределении Burr

Этот пример показывает, как найти и построить график функций выживания и опасности для выборки, исходящей из распределения Burr.

Сгенерируйте данные.

 X = 0:0.015:2.5;

Оцените PDF и CDF данных в X.

Xpdf = pdf('burr',X,0.2,5,0.5);
Xcdf = cdf('burr',X,0.2,5,0.5);

Оцените и постройте график функции выживания данных в X.

S = 1.-Xcdf; % survival function
plot(X,S,'LineWidth',2)
title('Survival function')
xlabel('x')

Figure contains an axes. The axes with title Survival function contains an object of type line.

Оцените и постройте график функции опасности данных в X.

H = Xpdf./S; % hazard function
plot(X,H,'r','LineWidth',2)
title('Hazard function')
xlabel('x')

Figure contains an axes. The axes with title Hazard function contains an object of type line.

Расхождение оценок параметров

Этот пример показывает, как интерпретировать отображение, когда оценки параметра расходятся при подгонке распределения Burr к входным данным.

1. Сгенерируйте выборочные данные из распределения Вейбула с параметрами 0,5 и 2.

rng('default') % for reproducibility
X = wblrnd(0.5,2,100,1);

2. Подбор распределения Burr.

PD = fitdist(X,'burr');
Error using addburr>burrfit (line 566)
The data are not fit by a Burr distribution with finite parameters. 
The maximum likelihood fit is provided by the k->Inf, alpha->Inf 
limiting form of the Burr distribution: a Weibull distribution 
with the parameters below.
	a (scale): 0.476817
	b (shape): 1.96219

Error in prob.BurrDistribution.fit (line 246)
            p = burrfit(x,0.05,cens,freq,opt);

Error in fitdist>localfit (line 238)
pd = feval(fitter,x,'cens',c,'freq',f,varargin{:});

Error in fitdist (line 185)
    pd = localfit(dist,fitter,x,cens,freq,args{:});

Сообщение об ошибке говорит вам, что семейство Weibull, по-видимому, лучше соответствует данным, и дает вам оценки параметров из подгонки Weibull. Можно использовать эти оценки непосредственно. Если вам нужны ковариационные оценки для параметров или другой информации о подгонке, можно привязать распределение Вейбула к данным.

3. Подбор распределения Вейбула к данным и поиск доверительных интервалов для оценок параметра.

PD = fitdist(X,'weibull');
paramci(PD)
ans =

    0.4291    1.6821
    0.5298    2.2890

Это 95% доверия интервалы оценок параметров для подгонки распределения Вейбула.

Ссылки

[1] Burr, Irving W. «Совокупные частотные функции». Анналы математической статистики, том 13, № 2, 1942, стр. 215-232.

[2] Tadikamalla, Pandu R. «Взгляд на Burr и связанные с ним распределения». Международный статистический обзор, том 48, № 3, 1980 год, стр. 337-344.

[3] Rodriguez, Robert N. «A guide to the Burr type XII distributions». Биометрика, том 64, № 1, 1977, с. 129-134.

[4] AL-Hussaini, Essam K. «Характеристика распределения Burr type XII». Appl. Math. Lett. vol. 4, Number 1, 1991, pp. 59-61.

[5] Грэммиг, Йоахим и Кай-Оливер Маурер. «Немонотонные функции опасности и модель авторегрессивной условной длительности». Econometrics Journal, Vol. 3, 2000, pp. 16-38.

См. также

Похожие темы