Обобщенное распределение Парето

Определение

Плотность распределения вероятности для обобщенного распределения Парето с параметром <reservedrangesplaceholder3>  <reservedrangesplaceholder2> формы, масштабный коэффициент σ, и параметром порога θ,

y=f(x|k,σ,θ)=(1σ)(1+k(xθ)σ)11k

для θ <x, когда k> 0, или для θ <x <θ - σ / k, когда k <0.

Для k = 0, плотность равна

y=f(x|0,σ,θ)=(1σ)e(xθ)σ

для θ < x.

Если k = 0 и θ = 0, обобщенное распределение Парето эквивалентно экспоненциальному распределению. Если k > 0 и θ = σ/ k, обобщённое распределение Парето эквивалентно распределению Парето с параметром шкалой, равным σ/ k и параметром формы, равным 1/ k.

Фон

Как и экспоненциальное распределение, обобщенное распределение Парето часто используется для моделирования хвостов другого распределения. Для примера у вас могут быть шайбы от производственного процесса. Если случайные влияния в процессе приводят к различиям в размерах шайб, для моделирования этих размеров может использоваться стандартное распределение вероятностей, такое как нормальное. Однако, хотя нормальное распределение может быть хорошей моделью около своего режима, это может быть неэффективной подгонкой к реальным данным в хвостах, и для описания полной области значений данных может потребоваться более сложная модель. С другой стороны, только запись размеров шайб, больших (или меньших), чем определенный порог, означает, что вы можете подгонять отдельную модель к тем данным о хвосте, которые известны как превышения. Можно использовать обобщенное распределение Парето таким образом, чтобы обеспечить хорошую подгонку к крайностям сложных данных.

Обобщенное распределение Парето позволяет непрерывная область значений возможных форм, который включает как экспоненциальное, так и Парето распределения в качестве особых случаев. Можно использовать любое из этих распределений, чтобы смоделировать конкретный набор данных с превышениями. Обобщенное распределение Парето позволяет вам «позволить данным решить», какое распределение подходит.

Обобщенное распределение Парето имеет три основные формы, каждая из которых соответствует ограничивающему распределению данных о превышении из другого класса базовых распределений.

  • Распределения, чьи хвосты уменьшаются экспоненциально, такие как normal, приводят к обобщенному параметру формы Парето с нулем.

  • Распределения, чьи хвосты уменьшаются как полином, такие как t Студента, приводят к положительному параметру формы.

  • Распределения, чьи хвосты конечны, такие как бета, приводят к отрицательному параметру формы.

Обобщенное распределение Парето используется в хвостах распределения подгонки объектов paretotails объект.

Параметры

Если вы генерируете большое количество случайных значений из t-распределения Студента с 5 степенями свободы, а затем отбрасываете все меньше 2, можно подгонять обобщенное распределение Парето к этим превышениям.

rng default  % For reproducibility
t = trnd(5,5000,1);
y = t(t > 2) - 2;
paramEsts = gpfit(y)
paramEsts = 1×2

    0.1445    0.7225

Заметьте, что оценка параметра формы (первый элемент) положительная, что вы ожидаете на основе превышений от распределения Student t.

hist(y+2,2.25:.5:11.75);
h = findobj(gca,'Type','patch');
h.FaceColor = [.8 .8 1];
xgrid = linspace(2,12,1000);
line(xgrid,.5*length(y)*...
     gppdf(xgrid,paramEsts(1),paramEsts(2),2));

Figure contains an axes. The axes contains 2 objects of type patch, line.

Примеры

Вычисление обобщенного распределения Парето в PDF

Вычислите PDF из трех обобщенных распределений Парето. Первый имеет параметр формы k = -0.25, второй имеет k = 0, а третий имеет k = 1.

x = linspace(0,10,1000);
y1 = gppdf(x,-.25,1,0); 
y2 = gppdf(x,0,1,0); 
y3 = gppdf(x,1,1,0);

Постройте график трех PDFS на том же рисунке.

figure;
plot(x,y1,'-', x,y2,'--', x,y3,':')
legend({'K < 0' 'K = 0' 'K > 0'});

Figure contains an axes. The axes contains 3 objects of type line. These objects represent K < 0, K = 0, K > 0.

Ссылки

[1] Embrechts, P., C. Klüppelberg, and T. Mikosch. Моделирование экстремальных событий для страхования и финансов. Нью-Йорк: Спрингер, 1997.

[2] Коц, С. и С. Надараджа. Экстремальные распределения значений: теория и приложения. Лондон: Imperial College Press, 2000.

См. также

Похожие темы