Бета- распределение описывает семейство кривых, которые уникальны тем, что они ненулевые только на интервале (0 1). Более общая версия функции присваивает параметры конечным точкам интервала.
Statistics and Machine Learning Toolbox™ предоставляет несколько способов работы с бета- распределением. Можно использовать следующие подходы, чтобы оценить параметры из выборочных данных, вычислить pdf, cdf и icdf, сгенерировать случайные числа и многое другое.
Подбор объекта распределения вероятностей к выборочным данным или создание объекта распределения вероятностей с заданными значениями параметров. См. Using
BetaDistribution
Objects
для получения дополнительной информации.
Работа с данными, вводимыми из матриц, таблиц и массивов наборов данных, с помощью функций распределения вероятностей. Список функций бета- Распределений см. в разделе Поддерживаемые распределения.
Интерактивная подгонка, исследование и генерация случайных чисел из распределения с помощью приложения или пользовательского интерфейса.
Для получения дополнительной информации о каждой из этих опций смотрите Работа с распределениями вероятностей.
Бета- распределение использует следующие параметры.
Параметр | Описание | Поддержка |
---|---|---|
a | Первый параметр формы | |
b | Второй параметр формы |
Функция плотности вероятностей (pdf) бета- распределения
где B (·) - Бета-функция. Функция индикации I (0,1) (x) гарантирует, что только значения x в области значений (0,1) имеют ненулевую вероятность.
Этот график показывает, как изменение значения параметров изменяет форму PDF. Константа pdf (плоская линия) показывает, что стандартное равномерное распределение является частным случаем бета-распределения, которое происходит при a = b = 1
.
X = 0:.01:1; y1 = betapdf(X,0.75,0.75); y2 = betapdf(X,1,1); y3 = betapdf(X,4,4); figure plot(X,y1,'Color','r','LineWidth',2) hold on plot(X,y2,'LineStyle','-.','Color','b','LineWidth',2) plot(X,y3,'LineStyle',':','Color','g','LineWidth',2) legend({'a = b = 0.75','a = b = 1','a = b = 4'},'Location','NorthEast'); hold off
Бета- распределение имеет функциональную связь с t распределения. Если Y является наблюдением от распределения t Стьюдента с ν степенями свободы, то следующее преобразование генерирует X, которая является бета-распределенной.
Если Y ~ t (v), то
Эта связь используется для вычисления значений t cdf и обратной функции, а также для генерации t распределенных случайных чисел.
beta cdf аналогичен неполной бета-функции.
Предположим, что вы собираете данные, которые имеют жесткие нижнюю и верхнюю границы, равные нулю и единице соответственно. Оценка параметра является процессом определения параметров бета- распределения, которые лучше всего соответствуют этим данным в некотором смысле.
Одним из популярных критериев качества является максимизация функции правдоподобия. Вероятность имеет ту же форму, что и бета- PDF. Но для PDF, параметры являются известными константами, и переменная является x. Функция правдоподобия отменяет роли переменных. Здесь значения выборки (x's) уже наблюдаются. Поэтому они являются фиксированными постоянными. Переменные являются неизвестными параметрами. Максимальная оценка правдоподобия (MLE) включает в себя вычисление значений параметров, которые дают самую высокую правдоподобность, учитывая конкретный набор данных.
Функция betafit
возвращает MLE и доверие интервалы для параметров бета- распределения. Вот пример использования случайных чисел из бета- распределения с a = 5
и b = 0.2
.
rng default % For reproducibility r = betarnd(5,0.2,100,1); [phat, pci] = betafit(r)
phat = 1×2
7.4911 0.2135
pci = 2×2
5.0861 0.1744
11.0334 0.2614
MLE для a параметров
равен 7.4911, по сравнению с истинным значением 5. 95% доверительный интервал для a
переходит с 5.0861 по 11.0334, что не включает в себя истинное значение. Хотя это маловероятный результат, иногда это происходит при оценке параметров распределения.
Точно так же MLE для b
параметра составляет 0,2135 по сравнению с истинным значением 0,2. 95% доверительный интервал для
b
переходит от 0,1744 до 0,2614, что включает в себя истинное значение. В этом выдуманном примере вы знаете «истинное значение». В экспериментах у вас нет.