Отрицательное биномиальное распределение

Определение

Когда параметр r является целым числом, отрицательный биномиальный pdf является

y=f(x|r,p)=(r+x1x)prqxI(0,1,...)(x)

где q = 1 - p. Когда r не является целым числом, биномиальный коэффициент в определении pdf заменяется эквивалентным выражением

Γ(r+x)Γ(r)Γ(x+1)

Фон

В самой простой форме (когда r является целым числом) отрицательное биномиальное распределение моделирует количество отказов x до достижения заданного количества успехов в серии независимых, идентичных испытаний. Его параметрами являются вероятность успеха в одном испытании, p, и количество успехов, r. Частным случаем отрицательного биномиального распределения, когда r = 1, является геометрическое распределение, которое моделирует количество отказов до первого успеха.

В более общем случае r может принимать нецелочисленные значения. Эта форма отрицательного биномиального распределения не имеет никакой интерпретации с точки зрения повторных испытаний, но, как и распределение Пуассона, она полезна при моделировании подсчета данных. Отрицательное биномиальное распределение является более общим, чем распределение Пуассона, потому что оно имеет отклонение, большую, чем среднее, что делает его подходящим для подсчета данных, которые не удовлетворяют предположениям распределения Пуассона. В пределе, когда r увеличивается до бесконечности, отрицательное биномиальное распределение приближается к распределению Пуассона.

Параметры

Предположим, вы собираете данные о количестве автоаварий на оживленной магистрали и хотели бы иметь возможность моделировать количество аварий в день. Поскольку это данные подсчета, и поскольку существует очень большое количество автомобилей и небольшая вероятность аварии для любого конкретного автомобиля, можно подумать использовать распределение Пуассона. Однако вероятность возникновения аварии, вероятно, будет варьироваться от дня к дню, когда погода и количество трафика изменяются, и поэтому предположения, необходимые для распределения Пуассона, не выполняются. В частности, отклонение данных подсчета этого типа иногда превышает среднее на большую величину. Приведенные ниже данные показывают этот эффект: большинство дней имеют мало или не имеют несчастных случаев, а несколько дней имеют большое количество.

accident = [2  3  4  2  3  1  12  8  14  31  23  1  10  7  0];
m = mean(accident)
m = 8.0667
v = var(accident)
v = 79.3524

Отрицательное биномиальное распределение является более общим, чем у Пуассона, и часто подходит для подсчета данных, когда Пуассона нет. Функция nbinfit возвращает максимальные оценки правдоподобия (MLE) и доверительные интервалы для параметров отрицательного биномиального распределения. Вот результаты подбора кривой accident данные:

[phat,pci] = nbinfit(accident)
phat = 1×2

    1.0060    0.1109

pci = 2×2

    0.2152    0.0171
    1.7968    0.2046

Трудно дать физическую интерпретацию в этом случае отдельным параметрам. Однако предполагаемые параметры могут использоваться в модели для количества ежедневных аварий. Например, график предполагаемой функции совокупной вероятности показывает, что, хотя существует предполагаемая 10% вероятность отсутствия несчастных случаев в данный день, существует также около 10% вероятность того, что будет 20 или более несчастных случаев.

plot(0:50,nbincdf(0:50,phat(1),phat(2)),'.-');
xlabel('Accidents per Day')
ylabel('Cumulative Probability')

Figure contains an axes. The axes contains an object of type line.

Пример

Вычисление и построение отрицательного биномиального распределения PDF

Вычислите и постройте график PDF, используя четыре различных значения для r параметра, желаемое количество успехов: .1, 1, 3, и 6. В каждом случае вероятность успеха p является .5.

x = 0:10;
plot(x,nbinpdf(x,.1,.5),'s-', ...
     x,nbinpdf(x,1,.5),'o-', ...
     x,nbinpdf(x,3,.5),'d-', ...
     x,nbinpdf(x,6,.5),'^-');
legend({'r = .1' 'r = 1' 'r = 3' 'r = 6'})
xlabel('x')
ylabel('f(x|r,p)')

Figure contains an axes. The axes contains 4 objects of type line. These objects represent r = .1, r = 1, r = 3, r = 6.

График показывает, что отрицательное биномиальное распределение может иметь различные формы, от очень искривленного до почти симметричного, в зависимости от значения r.

См. также

Похожие темы