Подпилите распределение типа XII

Определение

Распределение типа XII Берра является семейством распределений с тремя параметрами на положительной действительной строке. Кумулятивная функция распределения (cdf) распределения Берра

F(x|α,c,k)=11(1+(xα)c)k,x>0,α>0,c>0,k>0,

где c и k являются параметрами формы, и α является масштабным коэффициентом. Функция плотности вероятности (PDF)

f(x|α,c,k)=kcα(xα)c1(1+(xα)c)k+1,x>0,α>0,c>0,k>0 .

Плотность распределения типа XII Берра является L-образной если c ≤ 1 и одномодовый в противном случае.

Фон

Распределение Берра было сначала обсуждено Берром (1942) как семейство 2D параметров. Дополнительный масштабный коэффициент был введен Tadikamalla (1980). Это - гибкое семейство распределений, которое может выразить широкий спектр форм распределения. Распределение Берра включает, перекрывает или имеет как ограничивающий случай, много обычно используемых дистрибутивов, таких как гамма, логарифмически нормальная, loglogistic, колоколообразные, и J-образные бета дистрибутивы (но не U-образное). Некоторые составные дистрибутивы также соответствуют распределению Берра. Например, соединение распределения Вейбалла с гамма распределением для его масштабного коэффициента приводит к распределению Берра. Точно так же соединение экспоненциального распределения с гамма распределением для его параметра уровня, 1/μ, также приводит к распределению Берра. Распределение Берра также имеет два асимптотических ограничивающих случая: Вейбалл и Тип I Парето.

Распределение Берра может соответствовать широкому спектру эмпирических данных. Различные значения его параметров покрывают широкий набор скошенности и эксцесса. Следовательно, это используется в различных полях, таких как финансы, гидрология и надежность, чтобы смоделировать множество типов данных. Примеры данных, смоделированных распределением Берра, являются доходом семьи, обрезают цены, страховой риск, время прохождения, лавинно рассылают уровни и данные об отказе.

Выживание и функции опасности распределения типа XII Берра, соответственно,

S(x|α,c,k)=1[1+(xα)c]k

и

h(x|α,c,k)=kcα(xα)c11+(xα)c.

Если c> 1, функция опасности h (x) является немонотонной с режимом в x = α (c – 1) 1/c.

Параметры

Распределение Берра с тремя параметрами задано его масштабным коэффициентом α и параметры формы c и k. Можно оценить параметры с помощью mle или fitdist. Обе функции поддерживают подвергнутые цензуре данные для распределения Берра.

Сгенерируйте выборочные данные от распределения Берра с масштабным коэффициентом 0.5 и сформируйте параметры 2 и 5.

rng('default')
R = random('burr',0.5,2,5,1000,1);

Оцените параметры и доверительные интервалы.

[phat,pci] = mle(R,'distribution','burr')
phat =

    0.4154    2.1217    4.0550


pci =

    0.2985    1.9560    2.4079
    0.5782    2.3014    6.8288
Значение по умолчанию 95% доверительных интервалов для параметров включает истинные значения параметров.

Распределение Берра с тремя параметрами сходится асимптотически к одной из двух ограничивающих форм, когда его параметры отличаются:

  • Если k →0, c →∞, ck = λ, то распределение Берра уменьшает до 2D параметра распределение Парето с cdf

    FP=1(xα)λ,xα.

  • Если k →∞, α →∞, α/k1/c = θ, то распределение Берра уменьшает до 2D параметра распределение Weibull с cdf

    FW(x|c,θ)=1exp[(xθ)c].

Если mle или fitdist обнаруживают такое расхождение, это возвращает сообщение об ошибке, но сообщает вам об ограничивающем распределении и соответствующих оценках параметра для того распределения.

Соответствуйте Распределению Шума и Чертите cdf

Этот пример показывает, как соответствовать распределению Берра к данным, чертить cdf и создать гистограмму с подгонкой распределения Берра.

1. Загрузите выборочные данные.

load arrhythmia

Пятая колонна в X содержит измерение, полученное из электрокардиограмм, названных длительностью QRS.

2. Соответствуйте распределению Шума к данным о длительности QRS и получите оценки параметра.

PD = fitdist(X(:,5),'burr');

PD имеет оценки наибольшего правдоподобия параметров распределения Берра в свойстве Param. Оценки являются α = 80.4515, c = 18.9251, k = 0.4492.

3. Постройте cdf данных о длительности QRS.

QRScdf=cdf('burr',sortrows(X(:,5)),80.4515,18.9251,0.4492);
plot(sortrows(X(:,5)),QRScdf) 
title('QRS duration data')
xlabel('QRS Duration')

4. Чертите гистограмму данных о длительности QRS с 15 интервалами и PDF подгонки распределения Берра.

histfit(X(:,5),15,'burr')
title('Histogram of QRS data with a Burr distribution fit')
xlabel('QRS Duration')

Сравните Логарифмически нормальный и Распределение Шума pdfs

Сравните логарифмически нормальный PDF с доходными данными об использовании PDF Берра, сгенерированными от логарифмически нормального распределения.

Сгенерируйте доходные данные.

rng('default') % For reproducibility
y = random('Lognormal',log(25000),0.65,[500,1]);

Соответствуйте распределению Шума.

pd = fitdist(y,'burr')
pd = 
  BurrDistribution

  Burr distribution
    alpha = 26007.2   [21165.5, 31956.4]
        c = 2.63743   [2.3053, 3.0174]
        k = 1.09658   [0.775479, 1.55064]

Постройте и Шум и логарифмически нормальный pdfs поступивших данных по той же фигуре.

p_burr = pdf(pd,sortrows(y));
p_lognormal = pdf('Lognormal',sortrows(y),log(25000),0.65);
plot(sortrows(y),p_burr,'-',sortrows(y),p_lognormal,'-.')
title('Burr and Lognormal pdfs Fit to Income Data')
legend('Burr Distribution','Lognormal Distribution')

Подпилите PDF для Различных Параметров

Этот пример показывает, как создать множество форм для функций плотности вероятности распределения Берра.

X = 0:0.01:5;
c = [0.5 0.95 2 5];
k = [0.5 0.75 2 5];
alpha = [0.5 1 2 5];
colors = ['b';'g';'r';'k']';

figure
for i = 1:1:4
pdf1(i,:) = pdf('burr',X,1,c(i),0.5);
pdf2(i,:) = pdf('burr',X,1,2,k(i));
pdf3(i,:) = pdf('burr',X,alpha(i),2,0.5); 

axC = subplot(3,1,1);
pC(i) = plot(X,pdf1(i,:),colors(i),'LineWidth',2);
title('Effect of c, \alpha = 1, k = 0.5'),xlabel('x') 
hold on
 
axK = subplot(3,1,2);
pK(i) = plot(X,pdf2(i,:),colors(i),'LineWidth',2);
title('Effect of k, \alpha = 1, c = 2'),xlabel('x') 
hold on 

axAlpha = subplot(3,1,3);
pAlpha(i) = plot(X,pdf3(i,:),colors(i),'LineWidth',2);
title('Effect of \alpha, c = 2, k = 0.5'),xlabel('x') 
hold on
end

set(axC,'XLim',[0 3],'YLim',[0 1.2]);
set(axK,'XLim',[0 3],'YLim',[0 2.1]);
set(axAlpha,'XLim',[0 5],'YLim',[0 1]);

legend(axC,'c=0.5','c=0.95','c=2','c=5');
legend(axK,'k=0.5','k=0.75','k=2','k=5');
legend(axAlpha,'\alpha=0.5','\alpha=1','\alpha=2','\alpha=5');

Эта фигура иллюстрирует, как форма и шкала распределения Берра изменяются для различных значений его параметров.

Выживание и функции опасности распределения шума

Этот пример показывает, как найти и построить выживание и функции опасности для выборки, прибывающей из распределения Берра.

Сгенерируйте данные.

 X = 0:0.015:2.5;

Оцените PDF и cdf данных в X.

Xpdf = pdf('burr',X,0.2,5,0.5);
Xcdf = cdf('burr',X,0.2,5,0.5);

Оцените и постройте функцию выживания данных в X.

S = 1.-Xcdf; % survival function
plot(X,S,'LineWidth',2)
title('Survival function')
xlabel('x')

Оцените и постройте функцию опасности данных в X.

H = Xpdf./S; % hazard function
plot(X,H,'r','LineWidth',2)
title('Hazard function')
xlabel('x')

Расхождение оценок параметра

Этот пример показывает, как интерпретировать отображение, когда оценки параметра отличаются при подборе кривой распределению Берра к входным данным.

1. Сгенерируйте выборочные данные от распределения Weibull с параметрами 0.5 и 2.

rng('default') % for reproducibility
X = wblrnd(0.5,2,100,1);

2. Соответствуйте распределению Шума.

PD = fitdist(X,'burr');
Error using addburr>burrfit (line 566)
The data are not fit by a Burr distribution with finite parameters. 
The maximum likelihood fit is provided by the k->Inf, alpha->Inf 
limiting form of the Burr distribution: a Weibull distribution 
with the parameters below.
	a (scale): 0.476817
	b (shape): 1.96219

Error in prob.BurrDistribution.fit (line 246)
            p = burrfit(x,0.05,cens,freq,opt);

Error in fitdist>localfit (line 238)
pd = feval(fitter,x,'cens',c,'freq',f,varargin{:});

Error in fitdist (line 185)
    pd = localfit(dist,fitter,x,cens,freq,args{:});

Сообщение об ошибке говорит вам, что семейство Weibull, кажется, соответствует данным лучше и дает вам оценки параметра от подгонки Weibull. Можно использовать те оценки непосредственно. Если вам нужны оценки ковариации для параметров или другой информации о подгонке, можно переоборудовать распределение Weibull к данным.

3. Соответствуйте распределению Weibull к данным и найдите доверительные интервалы для оценок параметра.

PD = fitdist(X,'weibull');
paramci(PD)
ans =

    0.4291    1.6821
    0.5298    2.2890

Это 95% доверительных интервалов оценок параметра для подгонки распределения Weibull.

Ссылки

[1] Шипите, Ирвинг В. “Совокупные функции частоты”. Летопись Математической Статистики, Издания 13, Номера 2, 1942, стр 215–232.

[2] Tadikamalla, Пэнду Р. “Взгляд на Шум и связанные дистрибутивы”. Международный Статистический Анализ, Издание 48, Номер 3, 1980, стр 337–344.

[3] Родригес, Роберт Н. “Руководство по дистрибутивам типа XII Берра”. Biometrika, Издание 64, Номер 1, 1977, стр 129–134.

[4] AL-Hussaini, Эссам К. “Характеристика распределения типа XII Берра”. Прикладная Математика. Латыш. Издание 4, Номер 1, 1991, стр 59–61.

[5] Grammig, Джоаким и Kai-Oliver Маурер. “Немонотонная опасность функционирует и авторегрессивная условная модель длительности”. Журнал эконометрики, Издание 3, 2000, стр 16–38.

Смотрите также

Похожие темы

Для просмотра документации необходимо авторизоваться на сайте