Нормальное Распределение

Обзор

Нормальное распределение, иногда называемое Гауссовым распределением, является двухпараметрическим семейством кривых. Обычным обоснованием для использования нормального распределения для моделирования является теорема Центрального предела, которая утверждает (примерно), что сумма независимых выборок из любого распределения с конечным средним и отклонением сходится к нормальному распределению, когда размер выборки идёт к бесконечности.

Statistics and Machine Learning Toolbox™ предлагает несколько способов работать с нормальным распределением.

Создайте объект распределения вероятностей NormalDistribution подгонкой распределения вероятностей к выборочным данным (fitdist) или путем настройки значений параметров (makedist). Затем используйте функции объекта, чтобы вычислить распределение, сгенерировать случайные числа и так далее.
Работайте с нормальным распределением в интерактивном режиме при помощи приложения Distribution Fitter. Можно экспортировать объект из приложения и использовать функции объекта.
Используйте специфичные для распределения функции (normcdf, normpdf, norminv, normlike, normstat, normfit, normrnd) с заданными параметрами распределения. Функции, специфичные для распределения, могут принимать параметры нескольких нормальных распределений.
Используйте родовые функции распределения (cdf, icdf, pdf, random) с заданным именем распределения ('Normal') и параметры.

Параметры

Нормальное распределение использует эти параметры.

Параметр	Описание	Поддержка
`mu` (<reservedrangesplaceholder0>)	Средний	$- \infty < μ < \infty$
`sigma` (<reservedrangesplaceholder0>)	Стандартное отклонение	$σ \geq 0$

Стандартное нормальное распределение имеет нулевое среднее и единичное стандартное отклонение. Если z стандартная норма, то σ z + µ также нормально со средними µ и стандартными σ отклонения. Наоборот, если x нормально со средним µ и стандартным σ отклонения, то z = (x - µ )/ σ является стандартным нормальным.

Оценка параметра

Максимальные оценки правдоподобия (MLE) являются оценками параметра, которые максимизируют функцию правдоподобия. Максимальные оценки правдоподобия μ и σ² для нормального распределения, соответственно,

$\bar{x} = \sum_{i = 1}^{n} \frac{x_{i}}{n}$

$s_{MLE}^{2} = \frac{1}{n} \sum_{i = 1}^{n} {(x_{i} - \bar{x})}^{2} .$

$\bar{x}$ - среднее значение выборки для выборок x 1, _x 2,..._, x n. Среднее значение выборки является объективной оценкой μ параметра. Однако s²_MLE является смещенным оценщиком параметра σ², что означает, что его ожидаемое значение не равняется параметру.

Объективный оценщик минимального отклонения (MVUE) обычно используется, чтобы оценить параметры нормального распределения. MVUE является оценщиком, который имеет минимальное отклонение всех объективных оценок параметра. MVUE параметров μ и σ² для нормального распределения являются средним x̄ выборки и отклонением выборки s², соответственно.

$s^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} {(x_{i} - \bar{x})}^{2}$

Чтобы подогнать нормальное распределение к данным и найти оценки параметров, используйте normfit, fitdist, или mle.

Для данных без цензуры, normfit и fitdist найти объективные оценки, и mle находит максимальные оценки правдоподобия.
Для цензурированных данных, normfit, fitdist, и mle найти максимальные оценки правдоподобия.

В отличие от этого, normfit и mle, которые возвращают оценки параметров, fitdist возвращает установленный объект распределения вероятностей NormalDistribution. Свойства объекта mu и sigma сохраните оценки параметров.

Для получения примера смотрите Подгонку Normal Распределения Object.

Функция плотности вероятностей

Нормальная функция плотности вероятностей (pdf) является

$y = f (x | μ, σ) = \frac{1}{σ \sqrt{2 π}} e^{\frac{- {(x - μ)}^{2}}{2 σ^{2}}}, для x \in ℝ .$

Функция правдоподобия является PDF, рассматриваемой как функция от параметров. Максимальные оценки правдоподобия (MLE) являются оценками параметра, которые максимизируют функцию правдоподобия для фиксированных значений x.

Для получения примера смотрите Вычисление и График Распределения PDF Normal.

Кумулятивная функция распределения

Нормальная кумулятивная функция распределения (cdf)

$p = F (x | μ, σ) = \frac{1}{σ \sqrt{2 π}} \int_{- \infty}^{x} e^{\frac{- {(t - μ)}^{2}}{2 σ^{2}}} d t, для x \in ℝ .$

p - вероятность того, что одно наблюдение из нормального распределения с параметрами μ и σ падает в интервале (- ∞, x].

Стандартная нормальная кумулятивная функция распределения Φ (x) функционально связана с функцией ошибкиerf.

$Φ (x) = \frac{1}{2} (1 - erf (- \frac{x}{\sqrt{2}}))$

где

$erf (x) = \frac{2}{\sqrt{π}} \int_{0}^{x} e {}^{- t^{2}}d t = 2 Φ (\sqrt{2} x) - 1.$

Для получения примера смотрите График Standard Normal Распределения cdf

Примеры

Подбор нормального объекта распределения

Открыть Live Script

Загрузите выборочные данные и создайте вектор, содержащий первый столбец данных экзамена ученика.

load examgrades
x = grades(:,1);

Создайте нормальный объект распределения, подгоняя его к данным.

pd = fitdist(x,'Normal')

pd = 
  NormalDistribution

  Normal distribution
       mu = 75.0083   [73.4321, 76.5846]
    sigma =  8.7202   [7.7391, 9.98843]

Интервалы рядом с оценками параметров являются 95% доверительными интервалами для параметров распределения.

Вычислите и постройте график нормального распределения PDF

Открыть Live Script

Вычислите PDF стандартного нормального распределения с параметрами $μ$ равными 0 и $σ$ равным 1.

x = [-3:.1:3];
y = normpdf(x,0,1);

Постройте график PDF.

plot(x,y)

Figure contains an axes. The axes contains an object of type line.

Постройте график стандартного нормального распределения cdf

Открыть Live Script

Создайте стандартный нормальный объект распределения.

pd = makedist('Normal')

pd = 
  NormalDistribution

  Normal distribution
       mu = 0
    sigma = 1

Задайте x Значения и вычислите cdf.

x = -3:.1:3;
p = cdf(pd,x);

Постройте график cdf стандартного нормального распределения.

plot(x,p)

Figure contains an axes. The axes contains an object of type line.

Сравнение гаммы и нормального распределения PDFS

Открыть Live Script

Гамма- распределение имеет параметр формы $a$ и параметр шкалы $b$ . Для большого $a$ гамма-распределение близко аппроксимирует нормальное распределение со средним $μ = ab$ и отклонение $σ^{2} = a b^{2}$ .

Вычислите PDF гамма- распределения с параметрами a = 100 и b = 5.

a = 100;
b = 5;
x = 250:750;
y_gam = gampdf(x,a,b);

Для сравнения вычислите среднее значение, стандартное отклонение и PDF нормального распределения, которое гамма аппроксимирует.

mu = a*b

mu = 500

sigma = sqrt(a*b^2)

sigma = 50

y_norm = normpdf(x,mu,sigma);

Постройте график PDFS гамма-распределения и нормального распределения на том же рисунке.

plot(x,y_gam,'-',x,y_norm,'-.')
title('Gamma and Normal pdfs')
xlabel('Observation')
ylabel('Probability Density')
legend('Gamma Distribution','Normal Distribution')

Figure contains an axes. The axes with title Gamma and Normal pdfs contains 2 objects of type line. These objects represent Gamma Distribution, Normal Distribution.

PDF нормального распределения аппроксимирует PDF гамма-распределения.

Отношения между нормальным и Lognormal распределениями

Открыть Live Script

Если X следует за логарифмически нормальным распределением с параметрами µ и σ, то зарегистрируйтесь (X), следует за нормальным распределением со средним µ и стандартным отклонением σ. Используйте объекты распределения, чтобы просмотреть связь между нормальным и lognormal распределениями.

Создайте объект lognormal distribution путем определения значений параметров.

pd = makedist('Lognormal','mu',5,'sigma',2)

pd = 
  LognormalDistribution

  Lognormal distribution
       mu = 5
    sigma = 2

Вычислите среднее значение логнормального распределения.

mean(pd)

ans = 1.0966e+03

Среднее значение логнормального распределения не равно mu параметр. Среднее значение логарифмических значений равно mu. Подтвердите эту связь путем генерации случайных чисел.

Сгенерируйте случайные числа из логнормального распределения и вычислите их журнал значения.

rng('default');  % For reproducibility
x = random(pd,10000,1);
logx = log(x);

Вычислите среднее значение логарифмических значений.

m = mean(logx)

m = 5.0033

Среднее значение журнала x близко к mu параметр x, потому что x имеет логнормальное распределение.

Создайте гистограмму logx с нормальной распределительной подгонкой.

histfit(logx)

Figure contains an axes. The axes contains 2 objects of type bar, line.

График показывает, что значения журнала x обычно распределяются.

histfit использует fitdist для соответствия распределения данным. Использование fitdist для получения параметров, используемых в подборе кривой.

pd_normal = fitdist(logx,'Normal')

pd_normal = 
  NormalDistribution

  Normal distribution
       mu = 5.00332   [4.96445, 5.04219]
    sigma = 1.98296   [1.95585, 2.01083]

Предполагаемые нормальные параметры распределения близки к лагнормальным параметрам 5 и 2.

Сравнение `t` студента и Normal Distribution PDFs

Открыть Live Script

t распределения Ученика является семейством кривых в зависимости от единственного параметра Когда степени свободы и приближаются к бесконечности, распределение t приближается к стандартному нормальному распределению.

Вычислите PDFS для распределения Student's t с параметром nu = 5 и распределение Student t с параметром nu = 15.

x = [-5:0.1:5];
y1 = tpdf(x,5);
y2 = tpdf(x,15);

Рассчитать PDF для стандартного нормального распределения.

z = normpdf(x,0,1);

Постройте график t PDFS студента и стандартного обычного PDF на том же рисунке.

plot(x,y1,'-.',x,y2,'--',x,z,'-')
legend('Student''s t Distribution with \nu=5', ...
    'Student''s t Distribution with \nu=15', ...
    'Standard Normal Distribution','Location','best')
xlabel('Observation')
ylabel('Probability Density')
title('Student''s t and Standard Normal pdfs')

$Figure contains an axes. The axes with title Student's t and Standard Normal pdfs contains 3 objects of type line. These objects represent Student's t Distribution with \nu=5, Student's t Distribution with \nu=15, Standard Normal Distribution.$

Стандартный обычный PDF имеет более короткие хвосты, чем Student's t pdfs.

Связанные распределения

Биномиальное Распределение - биномиальное распределение моделирует общее количество успехов в n повторных испытаниях с вероятностью p успеха. Как n увеличений, биномиальное распределение может быть аппроксимировано нормальным распределением с µ = n p и σ² = <reservedrangesplaceholder2> <reservedrangesplaceholder1> (1–<reservedrangesplaceholder0>). См. «Сравнение биномиальных и нормальных распределений PDFS».
Распределение Бирнбаума-Сондерса - Если x имеет распределение Бирнбаума-Сондерса с параметрами β и γ, то

$\frac{(\sqrt{\frac{x}{β}} - \sqrt{\frac{β}{x}})}{γ}$
имеет стандартное нормальное распределение.
Распределение Хи-квадрат - распределение Хи-квадрат является распределением суммы квадратов, независимых, стандартных нормальных случайных переменных. Если набор n наблюдений обычно распределен с отклонением σ², и с² это дисперсия выборки (n -1) s²/ σ² имеет распределение хи-квадрат со n -1 степенями свободы. normfit функция использует это отношение, чтобы вычислить доверительные интервалы для оценки нормального параметра σ².
Экстремальное Распределение Значений - экстремальное распределение значений подходит для моделирования наименьшего или наибольшего значения из распределения, чьи хвосты распадаются экспоненциально быстро, например, нормальное распределение.
Гамма- Распределение - гамма- распределение имеет a параметра формы и b параметра шкалы. Для большого a гамма-распределение близко аппроксимирует нормальное распределение со средним μ = a b и дисперсией σ² = <reservedrangesplaceholder1> <reservedrangesplaceholder0>². Гамма- распределение имеет плотность только для положительных вещественных чисел. См. «Сравнение гамма-и нормального распределения PDF».
Полунормальное Распределение - полунормальное распределение является частным случаем сложенных нормальных и усеченных нормальных распределений. Если случайная переменная Z имеет стандартное нормальное распределение, тогда $X = μ + σ | Z |$ имеет половину нормального распределения с параметрами μ и σ.
Логистическое распределение - логистическое распределение используется для моделей роста и в логистической регрессии. У него более длинные хвосты и более высокий куртоз, чем у нормального распределения.
Lognormal Distribution - Если X следует логарифмическому распределению с параметрами µ и σ, то логарифмический (X) следует нормальному распределению со средним µ и стандартным σ отклонения. См. Взаимосвязь между нормальным и Lognormal распределениями.
Многомерное нормальное распределение - многомерное нормальное распределение является обобщением одномерного нормального для двух или более переменных. Это распределение для случайных векторов коррелированных переменных, в котором каждый элемент имеет одномерное нормальное распределение. В самом простом случае нет корреляции среди переменных, и элементы векторов являются независимыми, одномерными нормальными случайными переменными.
Распределение Пуассона - распределение Пуассона является дискретным распределением с одним параметром, которое принимает неотрицательные целочисленные значения. Параметр, λ, является и средним, и отклонением распределения. По мере λ увеличения распределение Пуассона может быть аппроксимировано нормальным распределением с µ = λ и σ² = λ.
Распределение Релея - распределение Релея является частным случаем распределения Вейбула с приложениями в теории связи. Если скорости компонента частицы в направлениях x и y являются двумя независимыми нормальными случайными переменными с нулем средств и равными отклонениями, то расстояние, которое частица перемещается за модуль времени, следует распределению Релея.
Стабильное Распределение - нормальное распределение является частным случаем стабильного распределения. Стабильное распределение с первым параметром формы α = 2 соответствует нормальному распределению.

$N (μ, σ^{2}) = S (2, 0, \frac{σ}{\sqrt{2}}, μ) .$
Распределение t студента - распределение t студента является семейством кривых, зависящих от одного ν параметра (степеней свободы). Когда ν степеней свободы переходит к бесконечности, распределение t приближается к стандартному нормальному распределению. См. «Сравнение t-х и Normal Distribution PDFS».
Если x является случайной выборкой размера, n из нормального распределения со средним μ, то статистическая

$t = \frac{\bar{x} - μ}{s / \sqrt{n}}$
где $\bar{x}$ - это среднее значение выборки, а s - стандартное отклонение выборки, имеет распределение t Студента с n -1 степенями свободы.
t Распределение шкалы местоположения - t распределение шкалы местоположения полезно для моделирования распределений данных с более тяжелыми хвостами (более подверженными выбросам), чем нормальное распределение. Он приближается к нормальному распределению, когда параметр shape

Ссылки

[1] Абрамовиц, М., и И. А. Штегун. Справочник по математическим функциям. Нью-Йорк: Дувр, 1964.

[2] Эванс, М., Н. Гастингс и Б. Пикок. Статистические распределения. 2nd ed. Hoboken, NJ: John Wiley & Sons, Inc., 1993.

[3] Lawless, J. F. Статистические модели и методы для пожизненных данных. Hoboken, NJ: Wiley-Interscience, 1982.

[4] Marsaglia, G., and W. W. Tsang. Быстрый, легко реализованный метод выборки из уменьшающихся или симметричных функций юнимодальной плотности. SIAM Journal on Scientific and Statistical Computing. Том 5, № 2, 1984, стр. 349-359.

[5] Микер, У. К. и Л. А. Эскобар. Статистические методы для данных о надежности. Hoboken, NJ: John Wiley & Sons, Inc., 1998.

См. также

Документация