Нормальное распределение, иногда называемое гауссовым распределением, представляет собой двухпараметрическое семейство кривых. Обычным обоснованием использования нормального распределения для моделирования является теорема о центральном пределе, которая утверждает (грубо), что сумма независимых выборок из любого распределения с конечным средним и дисперсией сходится к нормальному распределению по мере того, как размер выборки переходит в бесконечность.
Toolbox™ статистики и машинного обучения предлагает несколько способов работы с обычным распределением.
Создание объекта распределения вероятностей NormalDistribution подгонкой распределения вероятности к данным выборки (fitdistили путем указания значений параметров (makedist). Затем используйте объектные функции для вычисления распределения, генерации случайных чисел и т. д.
Работа с обычным дистрибутивом в интерактивном режиме с помощью приложения Distribution Fitter. Можно экспортировать объект из приложения и использовать функции объекта.
Использовать специфичные для распределения функции (normcdf, normpdf, norminv, normlike, normstat, normfit, normrnd) с указанными параметрами распределения. Специфичные для распределения функции могут принимать параметры нескольких нормальных распределений.
Использовать общие функции распределения (cdf, icdf, pdf, random) с указанным именем дистрибутива ('Normal') и параметры.
Нормальное распределение использует эти параметры.
| Параметр | Описание | Поддержка |
|---|---|---|
mu (μ) | Средний | |
sigma (σ) | Стандартное отклонение |
Стандартное нормальное распределение имеет нулевое среднее и единичное стандартное отклонение. Если z стандартный нормальный, то σz + µ также нормален со средним µ и стандартным отклонением σ. И наоборот, если x является нормальным со средним δ и стандартным отклонением
Оценки максимального правдоподобия (MLE) - это оценки параметров, которые максимизируют функцию правдоподобия. Максимальными оценщиками правдоподобия λ и start2 для нормального распределения, соответственно, являются
и
2.
- среднее значение для образцов x1, x2,..., xn. Среднее выборочное значение представляет собой несмещенный оценщик параметра λ. Однако s2MLE является смещенным оценщиком параметра, что означает, что его ожидаемое значение не равно параметру.
Для оценки параметров нормального распределения обычно используется устройство оценки без смещения минимальной дисперсии (MVUE). MVUE является оценщиком, который имеет минимальную дисперсию всех несмещенных оценщиков параметра. Значения MVUE параметров λ и λ 2 для нормального распределения представляют собой среднее x̄ выборки и дисперсию s2 выборки соответственно.
2
Чтобы подогнать нормальное распределение к данным и найти оценки параметров, используйте normfit, fitdist, или mle.
Для данных без цензуры, normfit и fitdist найти непредвзятые оценки, и mle находит оценки максимального правдоподобия.
Для данных, подвергнутых цензуре, normfit, fitdist, и mle найти оценки максимального правдоподобия.
В отличие от этого, normfit и mle, которые возвращают оценки параметров, fitdist возвращает аппроксимированный объект распределения вероятности NormalDistribution. Свойства объекта mu и sigma сохранить оценки параметров.
Пример см. в разделе Вписать нормальный объект распределения.
Нормальная функция плотности вероятности (pdf)
22λ 2, для x∈ℝ.
Функция правдоподобия представляет собой pdf, рассматриваемый как функция параметров. Оценки максимального правдоподобия (MLE) - это оценки параметров, которые максимизируют функцию правдоподобия для фиксированных значений x.
Пример см. в разделе Расчет и печать нормального распределения pdf.
Нормальная кумулятивная функция распределения (cdf)
для x∈ℝ.
p - вероятность того, что в интервале (- ∞,x] падает одиночное наблюдение из нормального распределения с параметрами λ и λ.
Стандартная нормальная кумулятивная функция (x) распределения функционально связана с функцией ошибкиerf.
(− x2))
где
− 1.
Пример см. в разделе Печать стандартного стандартного распределения CDF
Загрузите данные выборки и создайте вектор, содержащий первый столбец данных о классе экзамена.
load examgrades
x = grades(:,1);Создайте обычный объект распределения, подгоняя его к данным.
pd = fitdist(x,'Normal')pd =
NormalDistribution
Normal distribution
mu = 75.0083 [73.4321, 76.5846]
sigma = 8.7202 [7.7391, 9.98843]
Интервалы рядом с оценками параметров являются 95% доверительными интервалами для параметров распределения.
Вычислите PDF стандартного нормального распределения, при этом параметры будут равны 0, а - 1.
x = [-3:.1:3]; y = normpdf(x,0,1);
Постройте график pdf.
plot(x,y)

Создайте стандартный обычный объект распределения.
pd = makedist('Normal')pd =
NormalDistribution
Normal distribution
mu = 0
sigma = 1
Укажите x и вычислить cdf.
x = -3:.1:3; p = cdf(pd,x);
Постройте график стандартного нормального распределения.
plot(x,p)

Гамма-распределение имеет параметр формы и параметр масштаба . Для большого гамма-распределение близко аппроксимирует нормальное распределение со средним ab и ab2.
Вычисление pdf гамма-распределения с параметрами a = 100 и b = 5.
a = 100; b = 5; x = 250:750; y_gam = gampdf(x,a,b);
Для сравнения вычислите среднее значение, стандартное отклонение и pdf нормального распределения, которое приближается к гамма.
mu = a*b
mu = 500
sigma = sqrt(a*b^2)
sigma = 50
y_norm = normpdf(x,mu,sigma);
Постройте график pdfs гамма-распределения и нормального распределения на том же рисунке.
plot(x,y_gam,'-',x,y_norm,'-.') title('Gamma and Normal pdfs') xlabel('Observation') ylabel('Probability Density') legend('Gamma Distribution','Normal Distribution')

Pdf нормального распределения аппроксимирует pdf гамма-распределения.
Если X следует за логнормальным распределением с параметрами λ и, то log (X) следует за нормальным распределением со средним λ и среднеквадратическим отклонением Используйте объекты распределения для проверки взаимосвязи между нормальным и логнормальным распределением.
Создайте логнормальный объект распределения, указав значения параметров.
pd = makedist('Lognormal','mu',5,'sigma',2)
pd =
LognormalDistribution
Lognormal distribution
mu = 5
sigma = 2
Вычислите среднее значение логнормального распределения.
mean(pd)
ans = 1.0966e+03
Среднее логнормального распределения не равно mu параметр. Среднее логарифмических значений равно mu. Подтвердите эту связь, сгенерировав случайные числа.
Создайте случайные числа из логнормального распределения и вычислите их логарифмические значения.
rng('default'); % For reproducibility x = random(pd,10000,1); logx = log(x);
Вычислите среднее логарифмических значений.
m = mean(logx)
m = 5.0033
Среднее значение журнала регистрации x близок к mu параметр x, потому что x имеет логнормальное распределение.
Построение гистограммы logx с нормальным распределением.
histfit(logx)

На графике показано, что логарифмические значения x обычно распределяются.
histfit использование fitdist для соответствия распределения данным. Использовать fitdist получение параметров, используемых в фитинге.
pd_normal = fitdist(logx,'Normal')pd_normal =
NormalDistribution
Normal distribution
mu = 5.00332 [4.96445, 5.04219]
sigma = 1.98296 [1.95585, 2.01083]
Расчетные нормальные параметры распределения близки к логнормальным параметрам распределения 5 и 2.
t и нормальное распределение PDFSРаспределение Стьюдента (Student's t) представляет собой семейство кривых, зависящих от одного параметра (степеней свободы). По мере приближения степеней свободы к бесконечности распределение t приближается к стандартному нормальному распределению.
Вычислите pdfs для распределения Student с помощью параметра nu = 5 и распределение Стьюдента с параметром nu = 15.
x = [-5:0.1:5]; y1 = tpdf(x,5); y2 = tpdf(x,15);
Вычислите pdf для стандартного нормального распределения.
z = normpdf(x,0,1);
Постройте график t pdfs студента и стандартного обычного pdf на том же рисунке.
plot(x,y1,'-.',x,y2,'--',x,z,'-') legend('Student''s t Distribution with \nu=5', ... 'Student''s t Distribution with \nu=15', ... 'Standard Normal Distribution','Location','best') xlabel('Observation') ylabel('Probability Density') title('Student''s t and Standard Normal pdfs')

Стандартный обычный pdf имеет более короткие хвосты, чем t pdfs студента.
Биномиальное распределение (Binomial Distribution) - биномиальное распределение моделирует общее число успехов в n повторных испытаниях с вероятностью успеха p. По мере увеличения n биномиальное распределение может быть аппроксимировано нормальным распределением, при котором См. раздел Сравнение Binomial и Normal Distribution pdfs.
Распределение Бирнбаума-Сондерса - если х имеет распределение Бирнбаума-Сондерса с параметрами β и γ, то
) γ
имеет стандартное нормальное распределение.
Распределение хи-квадрат - распределение хи-квадрат - это распределение суммы квадратных, независимых, стандартных нормальных случайных величин. Если набор из n наблюдений нормально распределён с дисперсией start2, а s2 является дисперсией выборки, то (n-1) s2/start2 имеет хи-квадратное распределение с n-1 степенями свободы. normfit функция использует это соотношение для вычисления доверительных интервалов для оценки нормального параметра,
Распределение экстремальных значений - распределение экстремальных значений подходит для моделирования наименьшего или наибольшего значения из распределения, хвосты которого распадаются экспоненциально быстро, например, нормального распределения.
Гамма-распределение - гамма-распределение имеет параметр формы a и параметр масштаба b. Для большого а гамма-распределение близко аппроксимирует нормальное распределение со средним λ = ab и дисперсией λ 2 = ab2. Гамма-распределение имеет плотность только для положительных вещественных чисел. См. раздел Сравнение PDFS гаммы и нормального распределения.
Распределение по половинной нормали (Half-Normal Distribution) - распределение по половинной нормали является частным случаем распределения по сложенной нормали и усеченной нормали. Если случайная величина Z имеет стандартное нормальное распределение, то λ 'Z | имеет полупостоянное распределение с параметрами λ и λ.
Логистическое распределение - логистическое распределение используется для моделей роста и логистической регрессии. Он имеет более длинные хвосты и более высокий куртоз, чем нормальное распределение.
Логнормальное распределение (Lognormal Distribution) - Если X следует за логнормальным распределением с параметрами λ и λ, то log (X) следует за нормальным распределением со средним λ и стандартным отклонением λ. См. раздел Взаимосвязь между нормальным и логнормальным распределениями.
Многомерное нормальное распределение - многомерное нормальное распределение является обобщением одномерной нормали на две или более переменных. Является распределением для случайных векторов коррелированных переменных, в которых каждый элемент имеет одномерное нормальное распределение. В простейшем случае отсутствует корреляция между переменными, а элементы векторов являются независимыми, одномерными нормальными случайными переменными.
Распределение Пуассона - распределение Пуассона является однопараметрическим дискретным распределением, которое принимает неотрицательные целочисленные значения. Параметр λ является как средним, так и дисперсией распределения. По мере увеличения λ распределение Пуассона может быть аппроксимировано нормальным распределением, где λ = λ и λ 2 = λ.
Распределение Рэлея - распределение Рэлея является частным случаем распределения Вейбулла с приложениями в теории коммуникаций. Если скорости компонентов частицы в направлениях x и y являются двумя независимыми нормальными случайными переменными с нулевыми значениями и равными дисперсиями, то расстояние, которое частица проходит за единицу времени, следует за распределением Рэлея.
Стабильное распределение - нормальное распределение является частным случаем стабильного распределения. Стабильное распределение с первым параметром формы α = 2 соответствует нормальному распределению.
start2, λ).
Распределение Стьюдента (Student's t Distribution) - распределение Стьюдента (The Student's t distribution) представляет собой семейство кривых, зависящих от одного параметра (степеней свободы). Как степени свободы ν идет в бесконечность, t распределение приближается к стандартному нормальному распределению. См. раздел Сравнение PDFS студента и нормального распределения.
Если x - случайная выборка размера n из нормального распределения со средним λ, то статистика
мкс/н
где - среднее значение выборки, а s - стандартное отклонение выборки, имеет t-распределение Стьюдента с n-1 степенями свободы.
t Распределение по масштабу местоположения - распределение по масштабу местоположения полезно для моделирования распределений данных с более тяжелыми хвостами (более склонными к отклонениям), чем обычное распределение. Он приближается к нормальному распределению по мере того, как параметр «shape» приближается к бесконечности.
[1] Абрамовиц, М. и И. А. Стегун. Справочник по математическим функциям. Нью-Йорк: Дувр, 1964.
[2] Эванс, М., Н. Гастингс и Б. Павлин. Статистические распределения. 2-й ред. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 1993.
[3] Беззаконие, J.F. Статистические модели и методы для данных о сроке службы. Хобокен, Нью-Джерси: Wiley-Interscience, 1982.
[4] Марсалья, Г. и В. В. Цанг. «Быстрый, легко реализуемый метод выборки из убывающих или симметричных функций унимодальной плотности». Журнал СИАМ по научным и статистическим вычислениям. Том 5, номер 2, 1984, стр. 349-359.
[5] Микер, В. К. и Л. А. Эскобар. Статистические методы для данных о надежности. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 1998.
erf | NormalDistribution | normcdf | normfit | norminv | normlike | normpdf | normrnd | normstat