Нормальное распределение, иногда называемое Гауссовым распределением, является двухпараметрическим семейством кривых. Обычным обоснованием для использования нормального распределения для моделирования является теорема Центрального предела, которая утверждает (примерно), что сумма независимых выборок из любого распределения с конечным средним и отклонением сходится к нормальному распределению, когда размер выборки идёт к бесконечности.
Statistics and Machine Learning Toolbox™ предлагает несколько способов работать с нормальным распределением.
Создайте объект распределения вероятностей NormalDistribution
подгонкой распределения вероятностей к выборочным данным (fitdist
) или путем настройки значений параметров (makedist
). Затем используйте функции объекта, чтобы вычислить распределение, сгенерировать случайные числа и так далее.
Работайте с нормальным распределением в интерактивном режиме при помощи приложения Distribution Fitter. Можно экспортировать объект из приложения и использовать функции объекта.
Используйте специфичные для распределения функции (normcdf
, normpdf
, norminv
, normlike
, normstat
, normfit
, normrnd
) с заданными параметрами распределения. Функции, специфичные для распределения, могут принимать параметры нескольких нормальных распределений.
Используйте родовые функции распределения (cdf
, icdf
, pdf
, random
) с заданным именем распределения ('Normal'
) и параметры.
Нормальное распределение использует эти параметры.
Параметр | Описание | Поддержка |
---|---|---|
mu (<reservedrangesplaceholder0>) | Средний | |
sigma (<reservedrangesplaceholder0>) | Стандартное отклонение |
Стандартное нормальное распределение имеет нулевое среднее и единичное стандартное отклонение. Если z стандартная норма, то σ z + µ также нормально со средними µ и стандартными σ отклонения. Наоборот, если x нормально со средним µ и стандартным σ отклонения, то z = (x - µ )/ σ является стандартным нормальным.
Максимальные оценки правдоподобия (MLE) являются оценками параметра, которые максимизируют функцию правдоподобия. Максимальные оценки правдоподобия μ и σ2 для нормального распределения, соответственно,
и
- среднее значение выборки для выборок x 1, x 2,..., x n. Среднее значение выборки является объективной оценкой μ параметра. Однако s2MLE является смещенным оценщиком параметра σ2, что означает, что его ожидаемое значение не равняется параметру.
Объективный оценщик минимального отклонения (MVUE) обычно используется, чтобы оценить параметры нормального распределения. MVUE является оценщиком, который имеет минимальное отклонение всех объективных оценок параметра. MVUE параметров μ и σ2 для нормального распределения являются средним x̄ выборки и отклонением выборки s2, соответственно.
Чтобы подогнать нормальное распределение к данным и найти оценки параметров, используйте normfit
, fitdist
, или mle
.
Для данных без цензуры, normfit
и fitdist
найти объективные оценки, и mle
находит максимальные оценки правдоподобия.
Для цензурированных данных, normfit
, fitdist
, и mle
найти максимальные оценки правдоподобия.
В отличие от этого, normfit
и mle
, которые возвращают оценки параметров, fitdist
возвращает установленный объект распределения вероятностей NormalDistribution
. Свойства объекта mu
и sigma
сохраните оценки параметров.
Для получения примера смотрите Подгонку Normal Распределения Object.
Нормальная функция плотности вероятностей (pdf) является
Функция правдоподобия является PDF, рассматриваемой как функция от параметров. Максимальные оценки правдоподобия (MLE) являются оценками параметра, которые максимизируют функцию правдоподобия для фиксированных значений x
.
Для получения примера смотрите Вычисление и График Распределения PDF Normal.
Нормальная кумулятивная функция распределения (cdf)
p - вероятность того, что одно наблюдение из нормального распределения с параметрами μ и σ падает в интервале (- ∞, x].
Стандартная нормальная кумулятивная функция распределения Φ (x) функционально связана с функцией ошибкиerf
.
где
Для получения примера смотрите График Standard Normal Распределения cdf
Загрузите выборочные данные и создайте вектор, содержащий первый столбец данных экзамена ученика.
load examgrades
x = grades(:,1);
Создайте нормальный объект распределения, подгоняя его к данным.
pd = fitdist(x,'Normal')
pd = NormalDistribution Normal distribution mu = 75.0083 [73.4321, 76.5846] sigma = 8.7202 [7.7391, 9.98843]
Интервалы рядом с оценками параметров являются 95% доверительными интервалами для параметров распределения.
Вычислите PDF стандартного нормального распределения с параметрами равными 0 и равным 1.
x = [-3:.1:3]; y = normpdf(x,0,1);
Постройте график PDF.
plot(x,y)
Создайте стандартный нормальный объект распределения.
pd = makedist('Normal')
pd = NormalDistribution Normal distribution mu = 0 sigma = 1
Задайте x
Значения и вычислите cdf.
x = -3:.1:3; p = cdf(pd,x);
Постройте график cdf стандартного нормального распределения.
plot(x,p)
Гамма- распределение имеет параметр формы и параметр шкалы . Для большого гамма-распределение близко аппроксимирует нормальное распределение со средним и отклонение .
Вычислите PDF гамма- распределения с параметрами a = 100
и b = 5
.
a = 100; b = 5; x = 250:750; y_gam = gampdf(x,a,b);
Для сравнения вычислите среднее значение, стандартное отклонение и PDF нормального распределения, которое гамма аппроксимирует.
mu = a*b
mu = 500
sigma = sqrt(a*b^2)
sigma = 50
y_norm = normpdf(x,mu,sigma);
Постройте график PDFS гамма-распределения и нормального распределения на том же рисунке.
plot(x,y_gam,'-',x,y_norm,'-.') title('Gamma and Normal pdfs') xlabel('Observation') ylabel('Probability Density') legend('Gamma Distribution','Normal Distribution')
PDF нормального распределения аппроксимирует PDF гамма-распределения.
Если X следует за логарифмически нормальным распределением с параметрами µ и σ, то зарегистрируйтесь (X), следует за нормальным распределением со средним µ и стандартным отклонением σ. Используйте объекты распределения, чтобы просмотреть связь между нормальным и lognormal распределениями.
Создайте объект lognormal distribution путем определения значений параметров.
pd = makedist('Lognormal','mu',5,'sigma',2)
pd = LognormalDistribution Lognormal distribution mu = 5 sigma = 2
Вычислите среднее значение логнормального распределения.
mean(pd)
ans = 1.0966e+03
Среднее значение логнормального распределения не равно mu
параметр. Среднее значение логарифмических значений равно mu
. Подтвердите эту связь путем генерации случайных чисел.
Сгенерируйте случайные числа из логнормального распределения и вычислите их журнал значения.
rng('default'); % For reproducibility x = random(pd,10000,1); logx = log(x);
Вычислите среднее значение логарифмических значений.
m = mean(logx)
m = 5.0033
Среднее значение журнала x
близко к mu
параметр x
, потому что x
имеет логнормальное распределение.
Создайте гистограмму logx
с нормальной распределительной подгонкой.
histfit(logx)
График показывает, что значения журнала x
обычно распределяются.
histfit
использует fitdist
для соответствия распределения данным. Использование fitdist
для получения параметров, используемых в подборе кривой.
pd_normal = fitdist(logx,'Normal')
pd_normal = NormalDistribution Normal distribution mu = 5.00332 [4.96445, 5.04219] sigma = 1.98296 [1.95585, 2.01083]
Предполагаемые нормальные параметры распределения близки к лагнормальным параметрам 5 и 2.
t
студента
и Normal Distribution PDFst распределения Ученика является семейством кривых в зависимости от единственного параметра Когда степени свободы и приближаются к бесконечности, распределение t приближается к стандартному нормальному распределению.
Вычислите PDFS для распределения Student's t с параметром nu = 5
и распределение Student t с параметром nu = 15
.
x = [-5:0.1:5]; y1 = tpdf(x,5); y2 = tpdf(x,15);
Рассчитать PDF для стандартного нормального распределения.
z = normpdf(x,0,1);
Постройте график t PDFS студента и стандартного обычного PDF на том же рисунке.
plot(x,y1,'-.',x,y2,'--',x,z,'-') legend('Student''s t Distribution with \nu=5', ... 'Student''s t Distribution with \nu=15', ... 'Standard Normal Distribution','Location','best') xlabel('Observation') ylabel('Probability Density') title('Student''s t and Standard Normal pdfs')
Стандартный обычный PDF имеет более короткие хвосты, чем Student's t pdfs.
Биномиальное Распределение - биномиальное распределение моделирует общее количество успехов в n повторных испытаниях с вероятностью p успеха. Как n увеличений, биномиальное распределение может быть аппроксимировано нормальным распределением с µ = n p и σ2 = <reservedrangesplaceholder2> <reservedrangesplaceholder1> (1–<reservedrangesplaceholder0>). См. «Сравнение биномиальных и нормальных распределений PDFS».
Распределение Бирнбаума-Сондерса - Если x имеет распределение Бирнбаума-Сондерса с параметрами β и γ, то
имеет стандартное нормальное распределение.
Распределение Хи-квадрат - распределение Хи-квадрат является распределением суммы квадратов, независимых, стандартных нормальных случайных переменных. Если набор n наблюдений обычно распределен с отклонением σ2, и с2 это дисперсия выборки (n -1) s2/ σ2
имеет распределение хи-квадрат со n -1 степенями свободы. normfit
функция использует это отношение, чтобы вычислить доверительные интервалы для оценки нормального параметра σ2 .
Экстремальное Распределение Значений - экстремальное распределение значений подходит для моделирования наименьшего или наибольшего значения из распределения, чьи хвосты распадаются экспоненциально быстро, например, нормальное распределение.
Гамма- Распределение - гамма- распределение имеет a параметра формы и b параметра шкалы. Для большого a гамма-распределение близко аппроксимирует нормальное распределение со средним μ = a b и дисперсией σ2 = <reservedrangesplaceholder1> <reservedrangesplaceholder0>2. Гамма- распределение имеет плотность только для положительных вещественных чисел. См. «Сравнение гамма-и нормального распределения PDF».
Полунормальное Распределение - полунормальное распределение является частным случаем сложенных нормальных и усеченных нормальных распределений. Если случайная переменная Z
имеет стандартное нормальное распределение, тогда имеет половину нормального распределения с параметрами μ и σ.
Логистическое распределение - логистическое распределение используется для моделей роста и в логистической регрессии. У него более длинные хвосты и более высокий куртоз, чем у нормального распределения.
Lognormal Distribution - Если X следует логарифмическому распределению с параметрами µ и σ, то логарифмический (X) следует нормальному распределению со средним µ и стандартным σ отклонения. См. Взаимосвязь между нормальным и Lognormal распределениями.
Многомерное нормальное распределение - многомерное нормальное распределение является обобщением одномерного нормального для двух или более переменных. Это распределение для случайных векторов коррелированных переменных, в котором каждый элемент имеет одномерное нормальное распределение. В самом простом случае нет корреляции среди переменных, и элементы векторов являются независимыми, одномерными нормальными случайными переменными.
Распределение Пуассона - распределение Пуассона является дискретным распределением с одним параметром, которое принимает неотрицательные целочисленные значения. Параметр, λ, является и средним, и отклонением распределения. По мере λ увеличения распределение Пуассона может быть аппроксимировано нормальным распределением с µ = λ и σ2 = λ.
Распределение Релея - распределение Релея является частным случаем распределения Вейбула с приложениями в теории связи. Если скорости компонента частицы в направлениях x и y являются двумя независимыми нормальными случайными переменными с нулем средств и равными отклонениями, то расстояние, которое частица перемещается за модуль времени, следует распределению Релея.
Стабильное Распределение - нормальное распределение является частным случаем стабильного распределения. Стабильное распределение с первым параметром формы α = 2 соответствует нормальному распределению.
Распределение t студента - распределение t студента является семейством кривых, зависящих от одного ν параметра (степеней свободы). Когда ν степеней свободы переходит к бесконечности, распределение t приближается к стандартному нормальному распределению. См. «Сравнение t-х и Normal Distribution PDFS».
Если x является случайной выборкой размера, n из нормального распределения со средним μ, то статистическая
где - это среднее значение выборки, а s - стандартное отклонение выборки, имеет распределение t Студента с n -1 степенями свободы.
t Распределение шкалы местоположения - t распределение шкалы местоположения полезно для моделирования распределений данных с более тяжелыми хвостами (более подверженными выбросам), чем нормальное распределение. Он приближается к нормальному распределению, когда параметр shape
[1] Абрамовиц, М., и И. А. Штегун. Справочник по математическим функциям. Нью-Йорк: Дувр, 1964.
[2] Эванс, М., Н. Гастингс и Б. Пикок. Статистические распределения. 2nd ed. Hoboken, NJ: John Wiley & Sons, Inc., 1993.
[3] Lawless, J. F. Статистические модели и методы для пожизненных данных. Hoboken, NJ: Wiley-Interscience, 1982.
[4] Marsaglia, G., and W. W. Tsang. Быстрый, легко реализованный метод выборки из уменьшающихся или симметричных функций юнимодальной плотности. SIAM Journal on Scientific and Statistical Computing. Том 5, № 2, 1984, стр. 349-359.
[5] Микер, У. К. и Л. А. Эскобар. Статистические методы для данных о надежности. Hoboken, NJ: John Wiley & Sons, Inc., 1998.
erf
| NormalDistribution
| normcdf
| normfit
| norminv
| normlike
| normpdf
| normrnd
| normstat