exponenta event banner

Распределение Burr типа XII

Определение

Распределение Бёрра типа XII - трёхпараметрическое семейство распределений на положительной вещественной прямой. Кумулятивная функция распределения (cdf) распределения Бёрра

F (x 'α, c, k) = 1 1 (1 + () c) k, x > 0, α > 0, c > 0, k > 0,

где c и k - параметры формы, а α - параметр масштаба. Функция плотности вероятности (pdf)

f (x 'α, c, k) = kcα () c 1 (1 + () c) k + 1, x > 0, α > 0, c > 0, k > 0.

Плотность распределения Burr типа XII является L-образной, если c ≤ 1 и унимодальной, в противном случае.

Фон

Распределение Бёрра впервые обсуждалось Бёрром (1942) как двухпараметрическое семейство. Дополнительный параметр шкалы был введён Тадикамаллой (1980). Это гибкое семейство распределения, которое может выражать широкий спектр форм распределения. Распределение Бёрра включает, перекрывает или имеет в качестве ограничивающего случая многие обычно используемые распределения, такие как гамма, логнормальные, логлогогистические, колоколообразные и J-образные бета-распределения (но не U-образные). Некоторые составные распределения также соответствуют распределению Бёрра. Например, объединение распределения Вейбулла с гамма-распределением для его параметра масштаба приводит к распределению Бёрра. Аналогично, объединение экспоненциального распределения с гамма-распределением для его параметра скорости, 1/мкм, также дает распределение Бёрра. Распределение Бёрра также имеет два асимптотических ограничивающих случая: Weibull и Pareto Type I.

Распределение Бёрра может соответствовать широкому диапазону эмпирических данных. Различные значения его параметров охватывают широкий набор перекосов и куртозов. Следовательно, он используется в различных областях, таких как финансы, гидрология и надежность, для моделирования различных типов данных. Примерами данных, смоделированных распределением Бёрра, являются доходы домохозяйств, цены на урожай, страховой риск, время в пути, уровни наводнения и данные о неудачах.

Функции выживания и опасности распределения Burr типа XII, соответственно,

S (x 'α, c, k) = 1 [1 + (xα) c] k

и

h (x 'α, c, k) = kcα () c 11 + (xα) c.

Если c > 1, функция опасности h (x) является немонотонной с режимом при x = α (c-1) 1/c.

Параметры

Трехпараметрическое распределение Бёрра определяется его масштабным параметром α и параметрами формы c и k. Оценить параметры можно с помощью mle или fitdist. Обе функции поддерживают цензурированные данные для распределения Burr.

Создайте данные образца из распределения Бёрра с параметром масштаба 0,5 и параметрами формы 2 и 5.

rng('default')
R = random('burr',0.5,2,5,1000,1);

Оцените параметры и доверительные интервалы.

[phat,pci] = mle(R,'distribution','burr')
phat =

    0.4154    2.1217    4.0550


pci =

    0.2985    1.9560    2.4079
    0.5782    2.3014    6.8288
По умолчанию 95% доверительные интервалы для параметров включают истинные значения параметров.

Трехпараметрическое распределение Бёрра асимптотически сходится к одной из двух ограничивающих форм, когда его параметры расходятся:

  • Если k→0, c→∞, ck = λ, то распределение Бёрра сводится к двухпараметрическому распределению Парето с cdf

    FP = 1 () λ, x≥α.

  • Если k→∞, α→∞, α/k1/c = start, то распределение Бёрра сводится к двухпараметрическому распределению Вейбулла с cdf

    FW (x 'c, start) = 1 exp [(xstart) c].

Если mle или fitdist обнаруживает такую дивергенцию, возвращает сообщение об ошибке, но информирует об ограничительном распределении и соответствующих оценках параметров для этого распределения.

Подберите распределение Burr и нарисуйте cdf

В этом примере показано, как подогнать распределение Бёрра к данным, нарисовать cdf и построить гистограмму с посадкой распределения Бёрра.

1. Загрузите образцы данных.

load arrhythmia

Пятая колонна в X содержит измерение, полученное из электрокардиограмм, называемое длительностью QRS.

2. Подгоните распределение Бёрра к данным длительности QRS и получите оценки параметров.

PD = fitdist(X(:,5),'burr');

PD имеет максимальные оценки правдоподобия параметров распределения Бёрра в свойстве Param. Оценки α = 80,4515, c = 18,9251, k = 0,4492.

3. Постройте график cdf данных длительности QRS.

QRScdf=cdf('burr',sortrows(X(:,5)),80.4515,18.9251,0.4492);
plot(sortrows(X(:,5)),QRScdf) 
title('QRS duration data')
xlabel('QRS Duration')

Figure contains an axes. The axes with title QRS duration data contains an object of type line.

4. Нарисуйте гистограмму данных длительности QRS с 15 ячейками и pdf распределения Burr.

histfit(X(:,5),15,'burr')
title('Histogram of QRS data with a Burr distribution fit')
xlabel('QRS Duration')

Figure contains an axes. The axes with title Histogram of QRS data with a Burr distribution fit contains 2 objects of type bar, line.

Сравнение Lognormal и Burr Distribution pdfs

Сравните логнормальный pdf с беррским pdf, используя данные о доходах, полученные из логнормального распределения.

Создайте данные о доходах.

rng('default') % For reproducibility
y = random('Lognormal',log(25000),0.65,[500,1]);

Подогнать дистрибутив Бёрра.

pd = fitdist(y,'burr')
pd = 
  BurrDistribution

  Burr distribution
    alpha = 26007.2   [21165.5, 31956.4]
        c = 2.63743   [2.3053, 3.0174]
        k = 1.09658   [0.775479, 1.55064]

Постройте график как Burr, так и lognormal pdfs данных о доходах на одной и той же фигуре.

p_burr = pdf(pd,sortrows(y));
p_lognormal = pdf('Lognormal',sortrows(y),log(25000),0.65);
plot(sortrows(y),p_burr,'-',sortrows(y),p_lognormal,'-.')
title('Burr and Lognormal pdfs Fit to Income Data')
legend('Burr Distribution','Lognormal Distribution')

Figure contains an axes. The axes with title Burr and Lognormal pdfs Fit to Income Data contains 2 objects of type line. These objects represent Burr Distribution, Lognormal Distribution.

Burr pdf для различных параметров

В этом примере показано, как создать различные формы для функций плотности вероятности распределения Бёрра.

X = 0:0.01:5;
c = [0.5 0.95 2 5];
k = [0.5 0.75 2 5];
alpha = [0.5 1 2 5];
colors = ['b';'g';'r';'k']';

figure
for i = 1:1:4
pdf1(i,:) = pdf('burr',X,1,c(i),0.5);
pdf2(i,:) = pdf('burr',X,1,2,k(i));
pdf3(i,:) = pdf('burr',X,alpha(i),2,0.5); 

axC = subplot(3,1,1);
pC(i) = plot(X,pdf1(i,:),colors(i),'LineWidth',2);
title('Effect of c, \alpha = 1, k = 0.5'),xlabel('x') 
hold on
 
axK = subplot(3,1,2);
pK(i) = plot(X,pdf2(i,:),colors(i),'LineWidth',2);
title('Effect of k, \alpha = 1, c = 2'),xlabel('x') 
hold on 

axAlpha = subplot(3,1,3);
pAlpha(i) = plot(X,pdf3(i,:),colors(i),'LineWidth',2);
title('Effect of \alpha, c = 2, k = 0.5'),xlabel('x') 
hold on
end

set(axC,'XLim',[0 3],'YLim',[0 1.2]);
set(axK,'XLim',[0 3],'YLim',[0 2.1]);
set(axAlpha,'XLim',[0 5],'YLim',[0 1]);

legend(axC,'c=0.5','c=0.95','c=2','c=5');
legend(axK,'k=0.5','k=0.75','k=2','k=5');
legend(axAlpha,'\alpha=0.5','\alpha=1','\alpha=2','\alpha=5');

Figure contains 3 axes. Axes 1 with title Effect of c, \alpha = 1, k = 0.5 contains 4 objects of type line. These objects represent c=0.5, c=0.95, c=2, c=5. Axes 2 with title Effect of k, \alpha = 1, c = 2 contains 4 objects of type line. These objects represent k=0.5, k=0.75, k=2, k=5. Axes 3 with title Effect of \alpha, c = 2, k = 0.5 contains 4 objects of type line. These objects represent \alpha=0.5, \alpha=1, \alpha=2, \alpha=5.

На этом рисунке показано, как изменяется форма и масштаб распределения Бёрра для различных значений его параметров.

Функции выживания и опасности распределения Burr

В этом примере показано, как найти и построить график функций выживания и опасности для образца, поступающего из распределения Бёрра.

Создайте данные.

 X = 0:0.015:2.5;

Оценка pdf и cdf данных в X.

Xpdf = pdf('burr',X,0.2,5,0.5);
Xcdf = cdf('burr',X,0.2,5,0.5);

Оценка и построение графика функции выживания данных в X.

S = 1.-Xcdf; % survival function
plot(X,S,'LineWidth',2)
title('Survival function')
xlabel('x')

Figure contains an axes. The axes with title Survival function contains an object of type line.

Оценка и построение графика функции опасности данных в X.

H = Xpdf./S; % hazard function
plot(X,H,'r','LineWidth',2)
title('Hazard function')
xlabel('x')

Figure contains an axes. The axes with title Hazard function contains an object of type line.

Расхождение оценок параметров

В этом примере показано, как интерпретировать отображение, когда оценки параметров расходятся при подборе распределения Бёрра к входным данным.

1. Создайте данные выборки из распределения Вейбулла с параметрами 0,5 и 2.

rng('default') % for reproducibility
X = wblrnd(0.5,2,100,1);

2. Подогнать дистрибутив Бёрра.

PD = fitdist(X,'burr');
Error using addburr>burrfit (line 566)
The data are not fit by a Burr distribution with finite parameters. 
The maximum likelihood fit is provided by the k->Inf, alpha->Inf 
limiting form of the Burr distribution: a Weibull distribution 
with the parameters below.
	a (scale): 0.476817
	b (shape): 1.96219

Error in prob.BurrDistribution.fit (line 246)
            p = burrfit(x,0.05,cens,freq,opt);

Error in fitdist>localfit (line 238)
pd = feval(fitter,x,'cens',c,'freq',f,varargin{:});

Error in fitdist (line 185)
    pd = localfit(dist,fitter,x,cens,freq,args{:});

Сообщение об ошибке сообщает о том, что семейство Вейбулла, по-видимому, лучше подходит к данным, и дает оценки параметров из посадки Вейбулла. Эти оценки можно использовать непосредственно. Если необходимы оценки ковариации для параметров или другой информации о посадке, можно изменить распределение Вейбулла на данные.

3. Подгоните распределение Вейбулла к данным и найдите доверительные интервалы для оценок параметров.

PD = fitdist(X,'weibull');
paramci(PD)
ans =

    0.4291    1.6821
    0.5298    2.2890

Это 95% доверительные интервалы оценок параметров для аппроксимации распределения Вейбулла.

Ссылки

[1] Берр, Ирвинг В. «Кумулятивные частотные функции». Анналы математической статистики, т. 13, номер 2, 1942, стр. 215-232.

[2] Тадикамалла, Панду Р. «Взгляд на Burr и связанные с ним распределения». Международный статистический обзор, том 48, номер 3, 1980 год, стр. 337-344.

[3] Родригес, Роберт Н. «Руководство по дистрибутивам Burr типа XII». Биометрика, т. 64, № 1, 1977, стр. 129-134.

[4] АЛ-Хуссайни, Эссам К. «Характеристика распределения Бёрра типа XII». Апл. Мат. лет. том 4, номер 1, 1991, стр. 59-61.

[5] Граммиг, Иоахим и Кай-Оливер Маурер. «Немонотонные функции опасности и авторегрессионная модель условной длительности». Журнал эконометрики, том 3, 2000, стр. 16-38.

См. также

Связанные темы