Бета- Распределение

Обзор

Бета- распределение описывает семейство кривых, которые уникальны тем, что они ненулевые только на интервале (0 1). Более общая версия функции присваивает параметры конечным точкам интервала.

Statistics and Machine Learning Toolbox™ предоставляет несколько способов работы с бета- распределением. Можно использовать следующие подходы, чтобы оценить параметры из выборочных данных, вычислить pdf, cdf и icdf, сгенерировать случайные числа и многое другое.

  • Подбор объекта распределения вероятностей к выборочным данным или создание объекта распределения вероятностей с заданными значениями параметров. См. Using BetaDistribution Objects для получения дополнительной информации.

  • Работа с данными, вводимыми из матриц, таблиц и массивов наборов данных, с помощью функций распределения вероятностей. Список функций бета- Распределений см. в разделе Поддерживаемые распределения.

  • Интерактивная подгонка, исследование и генерация случайных чисел из распределения с помощью приложения или пользовательского интерфейса.

Для получения дополнительной информации о каждой из этих опций смотрите Работа с распределениями вероятностей.

Параметры

Бета- распределение использует следующие параметры.

ПараметрОписаниеПоддержка
aПервый параметр формыa>0
bВторой параметр формыb>0

Функция плотности вероятностей

Определение

Функция плотности вероятностей (pdf) бета- распределения

y=f(x|a,b)=1B(a,b)xa1(1x)b1I[0,1](x)

где B (·) - Бета-функция. Функция индикации I (0,1) (x) гарантирует, что только значения x в области значений (0,1) имеют ненулевую вероятность.

График

Этот график показывает, как изменение значения параметров изменяет форму PDF. Константа pdf (плоская линия) показывает, что стандартное равномерное распределение является частным случаем бета-распределения, которое происходит при a = b = 1.

X = 0:.01:1;
y1 = betapdf(X,0.75,0.75);
y2 = betapdf(X,1,1);
y3 = betapdf(X,4,4);

figure
plot(X,y1,'Color','r','LineWidth',2)
hold on
plot(X,y2,'LineStyle','-.','Color','b','LineWidth',2)
plot(X,y3,'LineStyle',':','Color','g','LineWidth',2)
legend({'a = b = 0.75','a = b = 1','a = b = 4'},'Location','NorthEast');
hold off

Figure contains an axes. The axes contains 3 objects of type line. These objects represent a = b = 0.75, a = b = 1, a = b = 4.

Отношение к другим распределениям

Бета- распределение имеет функциональную связь с t распределения. Если Y является наблюдением от распределения t Стьюдента с ν степенями свободы, то следующее преобразование генерирует X, которая является бета-распределенной.

X=12+12Yν+Y2

Если Y ~ t (v), тоXβ(ν2,ν2)

Эта связь используется для вычисления значений t cdf и обратной функции, а также для генерации t распределенных случайных чисел.

Кумулятивная функция распределения

beta cdf аналогичен неполной бета-функции.

Пример

Предположим, что вы собираете данные, которые имеют жесткие нижнюю и верхнюю границы, равные нулю и единице соответственно. Оценка параметра является процессом определения параметров бета- распределения, которые лучше всего соответствуют этим данным в некотором смысле.

Одним из популярных критериев качества является максимизация функции правдоподобия. Вероятность имеет ту же форму, что и бета- PDF. Но для PDF, параметры являются известными константами, и переменная является x. Функция правдоподобия отменяет роли переменных. Здесь значения выборки (x's) уже наблюдаются. Поэтому они являются фиксированными постоянными. Переменные являются неизвестными параметрами. Максимальная оценка правдоподобия (MLE) включает в себя вычисление значений параметров, которые дают самую высокую правдоподобность, учитывая конкретный набор данных.

Функция betafit возвращает MLE и доверие интервалы для параметров бета- распределения. Вот пример использования случайных чисел из бета- распределения с a = 5 и b = 0.2.

rng default  % For reproducibility
r = betarnd(5,0.2,100,1);
[phat, pci] = betafit(r)
phat = 1×2

    7.4911    0.2135

pci = 2×2

    5.0861    0.1744
   11.0334    0.2614

MLE для a параметров равен 7.4911, по сравнению с истинным значением 5. 95% доверительный интервал для a переходит с 5.0861 по 11.0334, что не включает в себя истинное значение. Хотя это маловероятный результат, иногда это происходит при оценке параметров распределения.

Точно так же MLE для b параметра составляет 0,2135 по сравнению с истинным значением 0,2. 95% доверительный интервал для b переходит от 0,1744 до 0,2614, что включает в себя истинное значение. В этом выдуманном примере вы знаете «истинное значение». В экспериментах у вас нет.

См. также

Похожие темы

Для просмотра документации необходимо авторизоваться на сайте