Бета распределение

Обзор

Бета распределение описывает семейство кривых, которые уникальны в этом, они являются ненулевыми только на интервале (0 1). Более общая версия функции присваивает параметры конечным точкам интервала.

Statistics and Machine Learning Toolbox™ обеспечивает несколько способов работать с бета распределением. Можно использовать следующие подходы, чтобы оценить параметры от выборочных данных, вычислить PDF, cdf, и icdf, сгенерировать случайные числа и т.д.

  • Соответствуйте объекту вероятностного распределения к выборочным данным или создайте объект вероятностного распределения с заданными значениями параметров. Смотрите Using BetaDistribution Objects для получения дополнительной информации.

  • Работа с вводом данных из матриц, таблиц и массивов набора данных с помощью функций распределения вероятностей. Смотрите Поддерживаемые Распределения для списка бета функций распределения.

  • В интерактивном режиме стройте, исследуйте и генерируйте случайные числа от распределения с помощью приложения или пользовательского интерфейса.

Для получения дополнительной информации о каждой из этих опций смотрите Работу с Вероятностными распределениями.

Параметры

Бета распределение использует следующие параметры.

ПараметрОписаниеПоддержка
aСначала сформируйте параметрa>0
bВторой параметр формыb>0

Функция плотности вероятности

Определение

Функция плотности вероятности (PDF) бета распределения

y=f(x|a,b)=1B(a,b)xa1(1x)b1I[0,1](x)

где B (·) Бета-функция. Функция индикатора I (0,1) (x) гарантирует, что только значения x в области значений (0,1) имеют ненулевую вероятность.

График

Этот график показывает, как изменение значения параметров изменяет форму PDF. Постоянная PDF (плоская линия) показывает, что стандартное равномерное распределение является особым случаем бета распределения, которое происходит когда a = b = 1.

X = 0:.01:1;
y1 = betapdf(X,0.75,0.75);
y2 = betapdf(X,1,1);
y3 = betapdf(X,4,4);

figure
plot(X,y1,'Color','r','LineWidth',2)
hold on
plot(X,y2,'LineStyle','-.','Color','b','LineWidth',2)
plot(X,y3,'LineStyle',':','Color','g','LineWidth',2)
legend({'a = b = 0.75','a = b = 1','a = b = 4'},'Location','NorthEast');
hold off

Связь с другими распределениями

Бета распределение имеет функциональное отношение с распределением t. Если Y является наблюдением от распределения t Студента со степенями свободы ν, то следующее преобразование генерирует X, который является распределенной бетой.

X=12+12Yν+Y2

Если Y ~t (v), то Xβ(ν2,ν2)

Это отношение является использованными для расчета значениями t cdf и обратной функции, а также генерации, t распределил случайные числа.

Кумулятивная функция распределения

Бета cdf совпадает с неполной бета-функцией.

Пример

Предположим, что вы собираете данные, которые имеют трудно нижние и верхние границы нуля и один соответственно. Оценка параметра является процессом определения параметров бета распределения, которые соответствуют этим данным лучше всего в некотором смысле.

Один популярный критерий совершенства должен максимизировать функцию правдоподобия. Вероятность имеет ту же форму как бета PDF. Но для PDF, параметры являются известными константами, и переменная является x. Функция правдоподобия инвертирует роли переменных. Здесь, демонстрационные значения (x's) уже наблюдаются. Таким образом, они - фиксированные постоянные. Переменные являются неизвестными параметрами. Оценка наибольшего правдоподобия (MLE) включает вычисление значений параметров, которые дают самую высокую вероятность, учитывая определенный набор данных.

Функция betafit возвращает MLEs и доверительные интервалы для параметров бета распределения. Вот пример с помощью случайных чисел от бета распределения с a = 5 и b = 0.2.

rng default  % For reproducibility
r = betarnd(5,0.2,100,1);
[phat, pci] = betafit(r)
phat = 1×2

    7.4911    0.2135

pci = 2×2

    5.0861    0.1744
   11.0334    0.2614

MLE для параметра a 7.4911, по сравнению с истинным значением 5. 95%-й доверительный интервал для a идет от 5,0861 до 11,0334, который не включает истинное значение. В то время как это - маловероятный результат, это действительно иногда происходит при оценке параметров распределения.

Так же MLE для параметра b 0.2135, по сравнению с истинным значением 0,2. 95%-й доверительный интервал для b идет от 0,1744 до 0,2614, который действительно включает истинное значение. В этом искусственном примере вы знаете “истинное значение”. В экспериментировании вы не делаете.

Смотрите также

Похожие темы