Когда параметр r является целым числом, отрицательный биномиальный pdf является
где q = 1 - p. Когда r не является целым числом, биномиальный коэффициент в определении pdf заменяется эквивалентным выражением
В самой простой форме (когда r является целым числом) отрицательное биномиальное распределение моделирует количество отказов x до достижения заданного количества успехов в серии независимых, идентичных испытаний. Его параметрами являются вероятность успеха в одном испытании, p, и количество успехов, r. Частным случаем отрицательного биномиального распределения, когда r = 1, является геометрическое распределение, которое моделирует количество отказов до первого успеха.
В более общем случае r может принимать нецелочисленные значения. Эта форма отрицательного биномиального распределения не имеет никакой интерпретации с точки зрения повторных испытаний, но, как и распределение Пуассона, она полезна при моделировании подсчета данных. Отрицательное биномиальное распределение является более общим, чем распределение Пуассона, потому что оно имеет отклонение, большую, чем среднее, что делает его подходящим для подсчета данных, которые не удовлетворяют предположениям распределения Пуассона. В пределе, когда r увеличивается до бесконечности, отрицательное биномиальное распределение приближается к распределению Пуассона.
Предположим, вы собираете данные о количестве автоаварий на оживленной магистрали и хотели бы иметь возможность моделировать количество аварий в день. Поскольку это данные подсчета, и поскольку существует очень большое количество автомобилей и небольшая вероятность аварии для любого конкретного автомобиля, можно подумать использовать распределение Пуассона. Однако вероятность возникновения аварии, вероятно, будет варьироваться от дня к дню, когда погода и количество трафика изменяются, и поэтому предположения, необходимые для распределения Пуассона, не выполняются. В частности, отклонение данных подсчета этого типа иногда превышает среднее на большую величину. Приведенные ниже данные показывают этот эффект: большинство дней имеют мало или не имеют несчастных случаев, а несколько дней имеют большое количество.
accident = [2 3 4 2 3 1 12 8 14 31 23 1 10 7 0]; m = mean(accident)
m = 8.0667
v = var(accident)
v = 79.3524
Отрицательное биномиальное распределение является более общим, чем у Пуассона, и часто подходит для подсчета данных, когда Пуассона нет. Функция nbinfit
возвращает максимальные оценки правдоподобия (MLE) и доверительные интервалы для параметров отрицательного биномиального распределения. Вот результаты подбора кривой accident
данные:
[phat,pci] = nbinfit(accident)
phat = 1×2
1.0060 0.1109
pci = 2×2
0.2152 0.0171
1.7968 0.2046
Трудно дать физическую интерпретацию в этом случае отдельным параметрам. Однако предполагаемые параметры могут использоваться в модели для количества ежедневных аварий. Например, график предполагаемой функции совокупной вероятности показывает, что, хотя существует предполагаемая 10% вероятность отсутствия несчастных случаев в данный день, существует также около 10% вероятность того, что будет 20 или более несчастных случаев.
plot(0:50,nbincdf(0:50,phat(1),phat(2)),'.-'); xlabel('Accidents per Day') ylabel('Cumulative Probability')
Вычислите и постройте график PDF, используя четыре различных значения для r
параметра, желаемое количество успехов:
.1
, 1
, 3
, и 6
. В каждом случае вероятность успеха p
является .5
.
x = 0:10; plot(x,nbinpdf(x,.1,.5),'s-', ... x,nbinpdf(x,1,.5),'o-', ... x,nbinpdf(x,3,.5),'d-', ... x,nbinpdf(x,6,.5),'^-'); legend({'r = .1' 'r = 1' 'r = 3' 'r = 6'}) xlabel('x') ylabel('f(x|r,p)')
График показывает, что отрицательное биномиальное распределение может иметь различные формы, от очень искривленного до почти симметричного, в зависимости от значения r
.