exponenta event banner

Бета-дистрибутив

Обзор

Бета-распределение описывает семейство кривых, которые уникальны тем, что они ненулевые только на интервале (0 1). Более общая версия функции назначает параметры конечным точкам интервала.

Toolbox™ статистики и машинного обучения предоставляет несколько способов работы с бета-дистрибутивом. Можно использовать следующие подходы для оценки параметров на основе выборочных данных, вычисления pdf, cdf и icdf, генерации случайных чисел и т. д.

  • Поместите объект распределения вероятностей в выборку данных или создайте объект распределения вероятностей с заданными значениями параметров. Посмотрите Using BetaDistribution Objects для получения дополнительной информации.

  • Работа с данными, вводимыми из матриц, таблиц и массивов наборов данных, с использованием функций распределения вероятностей. Список функций бета-распространения см. в разделе Поддерживаемые дистрибутивы.

  • Интерактивно подгоняйте, исследуйте и генерируйте случайные числа из дистрибутива с помощью приложения или пользовательского интерфейса.

Дополнительные сведения о каждой из этих опций см. в разделе Работа с распределениями вероятностей.

Параметры

Бета-дистрибутив использует следующие параметры.

ПараметрОписаниеПоддержка
aПервый параметр формыa > 0
bПараметр второй формыb > 0

Функция плотности вероятности

Определение

Функция плотности вероятности (pdf) бета-распределения

y = f (x 'a, b) = 1B (a, b) xa 1 (1 x) b − 1I [0,1] (x)

где B (·) - бета-функция. Индикаторная функция I (0,1) (x) гарантирует, что только значения x в диапазоне (0,1) имеют ненулевую вероятность.

График

На этом графике показано, как изменение значения параметров изменяет форму pdf. Константа pdf (плоская линия) показывает, что стандартное равномерное распределение является частным случаем бета-распределения, которое происходит, когда a = b = 1.

X = 0:.01:1;
y1 = betapdf(X,0.75,0.75);
y2 = betapdf(X,1,1);
y3 = betapdf(X,4,4);

figure
plot(X,y1,'Color','r','LineWidth',2)
hold on
plot(X,y2,'LineStyle','-.','Color','b','LineWidth',2)
plot(X,y3,'LineStyle',':','Color','g','LineWidth',2)
legend({'a = b = 0.75','a = b = 1','a = b = 4'},'Location','NorthEast');
hold off

Figure contains an axes. The axes contains 3 objects of type line. These objects represent a = b = 0.75, a = b = 1, a = b = 4.

Связь с другими дистрибутивами

Бета-распределение имеет функциональную связь с t-распределением. Если Y является наблюдением из распределения Стьюдента t со степенями свободы, то следующее преобразование генерирует X, который является бета-распределенным.

X = 12 + 12Yν + Y2

Если Y ~ t (v), то X∼β (start2, start2)

Это соотношение используется для вычисления значений t cdf и обратной функции, а также для генерирования t распределенных случайных чисел.

Функция совокупного распределения

Бета-cdf такая же, как и неполная бета-функция.

Пример

Предположим, вы собираете данные, которые имеют жесткую нижнюю и верхнюю границы, равные нулю и единице соответственно. Оценка параметров - это процесс определения параметров бета-распределения, которые наилучшим образом соответствуют этим данным в некотором смысле.

Одним из популярных критериев благости является максимизация функции правдоподобия. Вероятность имеет ту же форму, что и бета-pdf. Но для pdf параметры являются известными константами, а переменная - x. Функция правдоподобия меняет роли переменных. Здесь значения выборки (x) уже наблюдаются. Таким образом, они являются фиксированными константами. Переменные являются неизвестными параметрами. Оценка максимального правдоподобия (MLE) включает в себя вычисление значений параметров, которые дают наибольшее правдоподобие, учитывая конкретный набор данных.

Функция betafit возвращает MLE и доверительные интервалы для параметров бета-распределения. Вот пример использования случайных чисел из бета-распределения с a = 5 и b = 0.2.

rng default  % For reproducibility
r = betarnd(5,0.2,100,1);
[phat, pci] = betafit(r)
phat = 1×2

    7.4911    0.2135

pci = 2×2

    5.0861    0.1744
   11.0334    0.2614

MLE для параметра a 7.4911, по сравнению с истинным значением 5. 95% доверительный интервал для a идет от 5.0861 до 11.0334, что не включает истинное значение. Хотя это маловероятный результат, иногда это происходит при оценке параметров распределения.

Аналогично MLE для параметра b составляет 0,2135 по сравнению с истинным значением 0,2. 95% доверительный интервал для b переходит от 0,1744 к 0,2614, что включает истинное значение. В этом выдуманном примере вы знаете «истинное значение». В экспериментах вы этого не делаете.

См. также

Связанные темы