exponenta event banner

Отрицательное биномиальное распределение

Определение

Если параметр r является целым числом, отрицательное значение binomial pdf равно

y = f (x 'r, p) = (r + x 1x) prqxI (0,1,...) (x)

где q = 1 - р. Если r не является целым числом, биномиальный коэффициент в определении pdf заменяется эквивалентным выражением

Γ (r + x) Γ (r) Γ (x + 1)

Фон

В простейшем виде (когда r - целое число) отрицательное биномиальное распределение моделирует количество отказов x до достижения заданного числа успехов в серии независимых, идентичных испытаний. Его параметрами являются вероятность успеха в одном испытании, p, и количество успехов, r. Частным случаем отрицательного биномиального распределения, когда r = 1, является геометрическое распределение, которое моделирует количество отказов до первого успеха.

В более общем случае r может принимать не целочисленные значения. Эта форма отрицательного биномиального распределения не имеет интерпретации с точки зрения повторных испытаний, но, как и распределение Пуассона, она полезна при моделировании данных подсчета. Отрицательное биномиальное распределение является более общим, чем распределение Пуассона, потому что оно имеет дисперсию, которая больше, чем его среднее значение, что делает его подходящим для данных подсчета, которые не соответствуют предположениям распределения Пуассона. В пределе, по мере увеличения r до бесконечности, отрицательное биномиальное распределение приближается к распределению Пуассона.

Параметры

Предположим, вы собираете данные о количестве автоаварий на оживленной трассе, и хотели бы иметь возможность моделировать количество ДТП в день. Потому что это данные подсчета, и потому что есть очень большое количество автомобилей и небольшая вероятность аварии для любого конкретного автомобиля, вы можете подумать, чтобы использовать распределение Пуассона. Однако вероятность аварии, вероятно, будет меняться изо дня в день по мере изменения погоды и количества движения, и поэтому предположения, необходимые для распределения Пуассона, не выполняются. В частности, дисперсия данных подсчета этого типа иногда превышает среднее значение на большую величину. Данные ниже показывают этот эффект: большинство дней имеют мало несчастных случаев или нет, а несколько дней имеют большое количество.

accident = [2  3  4  2  3  1  12  8  14  31  23  1  10  7  0];
m = mean(accident)
m = 8.0667
v = var(accident)
v = 79.3524

Отрицательное биномиальное распределение более общее, чем Пуассон, и часто подходит для подсчета данных, когда Пуассон не. nbinfit возвращает оценки максимального правдоподобия (MLE) и доверительные интервалы для параметров отрицательного биномиального распределения. Вот результаты подбора accident данные:

[phat,pci] = nbinfit(accident)
phat = 1×2

    1.0060    0.1109

pci = 2×2

    0.2152    0.0171
    1.7968    0.2046

Трудно дать физическую интерпретацию в данном случае отдельным параметрам. Однако расчетные параметры могут быть использованы в модели по количеству ежедневных аварий. Например, график расчетной кумулятивной вероятностной функции показывает, что, хотя существует предполагаемая 10% вероятность отсутствия аварий в данный день, существует также примерно 10% вероятность того, что будет 20 или более аварий.

plot(0:50,nbincdf(0:50,phat(1),phat(2)),'.-');
xlabel('Accidents per Day')
ylabel('Cumulative Probability')

Figure contains an axes. The axes contains an object of type line.

Пример

Расчет и печать отрицательного биномиального распределения PDF

Вычисление и печать pdf с использованием четырех различных значений параметра r, желаемое число успехов: .1, 1, 3, и 6. В каждом случае вероятность успеха p является .5.

x = 0:10;
plot(x,nbinpdf(x,.1,.5),'s-', ...
     x,nbinpdf(x,1,.5),'o-', ...
     x,nbinpdf(x,3,.5),'d-', ...
     x,nbinpdf(x,6,.5),'^-');
legend({'r = .1' 'r = 1' 'r = 3' 'r = 6'})
xlabel('x')
ylabel('f(x|r,p)')

Figure contains an axes. The axes contains 4 objects of type line. These objects represent r = .1, r = 1, r = 3, r = 6.

График показывает, что отрицательное биномиальное распределение может принимать различные формы, варьирующиеся от очень скошенных до почти симметричных, в зависимости от значения r.

См. также

Связанные темы