Отрицательное биномиальное распределение

Определение

Когда параметр r является целым числом, отрицательный биномиальный PDF

y=f(x|r,p)=(r+x1x)prqxI(0,1,...)(x)

где q = 1 – p. Когда r не является целым числом, биномиальный коэффициент в определении PDF заменяется эквивалентным выражением

Γ(r+x)Γ(r)Γ(x+1)

Фон

В его самой простой форме (когда r является целым числом), отрицательное биномиальное распределение моделирует количество отказов x, прежде чем конкретное количество успехов будет достигнуто в ряду независимых, идентичных испытаний. Его параметры являются вероятностью успеха в одном испытании, p, и количеством успехов, r. Особый случай отрицательного биномиального распределения, когда r = 1, является геометрическим распределением, которое моделирует количество отказов перед первым успехом.

В более общем плане r может взять значения нецелого числа. Эта форма отрицательного биномиального распределения не имеет никакой интерпретации в терминах повторных испытаний, но, как распределение Пуассона, это полезно в моделировании данных о количестве. Отрицательное биномиальное распределение является более общим, чем распределение Пуассона, потому что это имеет отклонение, которое больше его среднего значения, делая его подходящим для данных о количестве, которые не соответствуют предположениям о распределении Пуассона. В пределе, когда r увеличивается до бесконечности, отрицательное биномиальное распределение приближается к распределению Пуассона.

Параметры

Предположим, что вы собираете данные по количеству автомобильных аварий на оживленной магистрали и хотели бы смочь смоделировать количество несчастных случаев в день. Поскольку это данные о количестве, и потому что существует очень большое количество автомобилей и маленькая вероятность несчастного случая для любого определенного автомобиля, вы можете думать, чтобы использовать распределение Пуассона. Однако вероятность того, чтобы попадать в аварию, вероятно, будет варьироваться со дня на день как погода и количество изменения трафика, и таким образом, предположениям, необходимым для распределения Пуассона, не будут соответствовать. В частности, отклонение этого типа данных о количестве иногда превышает среднее значение большой суммой. Данные ниже показывают этот эффект: большинство дней имеет немногих или никакие несчастные случаи, и несколько дней имеют большое количество.

accident = [2  3  4  2  3  1  12  8  14  31  23  1  10  7  0];
m = mean(accident)
m = 8.0667
v = var(accident)
v = 79.3524

Отрицательное биномиальное распределение является более общим, чем Пуассон и часто подходит для данных о количестве, когда Пуассон не. Функциональный nbinfit возвращает оценки наибольшего правдоподобия (MLEs) и доверительные интервалы для параметров отрицательного биномиального распределения. Вот результаты подбора кривой accident данные:

[phat,pci] = nbinfit(accident)
phat = 1×2

    1.0060    0.1109

pci = 2×2

    0.2152    0.0171
    1.7968    0.2046

Это затрудняет, чтобы дать физическую интерпретацию в этом случае отдельным параметрам. Однако предполагаемые параметры могут использоваться в модели в количестве ежедневных несчастных случаев. Например, график предполагаемой функции интегральной вероятности показывает, что, в то время как существует приблизительно 10%-й шанс никаких несчастных случаев в данный день, существует также приблизительно 10%-й шанс, что будет 20 или больше несчастных случаев.

plot(0:50,nbincdf(0:50,phat(1),phat(2)),'.-');
xlabel('Accidents per Day')
ylabel('Cumulative Probability')

Пример

Вычислите и постройте отрицательное биномиальное распределение PDF

Вычислите и постройте PDF с помощью четырех различных значений в параметре r, желаемое количество успехов: .1, 1, 3, и 6. В каждом случае, вероятности успеха p .5.

x = 0:10;
plot(x,nbinpdf(x,.1,.5),'s-', ...
     x,nbinpdf(x,1,.5),'o-', ...
     x,nbinpdf(x,3,.5),'d-', ...
     x,nbinpdf(x,6,.5),'^-');
legend({'r = .1' 'r = 1' 'r = 3' 'r = 6'})
xlabel('x')
ylabel('f(x|r,p)')

График показывает, что отрицательное биномиальное распределение может взять множество форм, в пределах от очень скошенного к почти симметричному, в зависимости от значения r.

Смотрите также

Похожие темы