Нормальное распределение, иногда названное Распределением Гаусса, является семейством кривых 2D параметра. Обычным выравниванием для использования нормального распределения для моделирования является Центральная предельная теорема, которая утверждает (примерно), что сумма независимых выборок от любого распределения с конечным средним значением и отклонением сходится к нормальному распределению, когда объем выборки переходит к бесконечности.
Statistics and Machine Learning Toolbox™ предлагает несколько способов работать с нормальным распределением.
Создайте объект NormalDistribution
распределения вероятностей путем подбора кривой распределению вероятностей к выборочным данным (fitdist
) или путем определения значений параметров (makedist
). Затем используйте объектные функции, чтобы оценить распределение, сгенерировать случайные числа, и так далее.
Работа с нормальным распределением в интерактивном режиме при помощи приложения Distribution Fitter. Можно экспортировать объект из приложения и использовать объектные функции.
Используйте специфичные для распределения функции (normcdf
, normpdf
, norminv
, normlike
, normstat
, normfit
, normrnd
) с заданными параметрами распределения. Специфичные для распределения функции могут принять параметры нескольких нормальных распределений.
Используйте типичные функции распределения (cdf
, icdf
, pdf
, random
) с заданным именем распределения ('Normal'
) и параметры.
Нормальное распределение использует эти параметры.
Параметр | Описание | Поддержка |
---|---|---|
mu (μ) | Среднее значение | |
sigma (σ) | Стандартное отклонение |
Стандартное нормальное распределение имеет нулевое среднее значение и модульное стандартное отклонение. Если z стандартный нормальный, то σ z + µ также нормален со средним µ и стандартным отклонением σ. С другой стороны, если x нормален со средним µ и стандартным отклонением σ, то z = (x – µ) / σ стандартный нормальный.
Оценки наибольшего правдоподобия (MLEs) являются оценками параметра, которые максимизируют функцию правдоподобия. Средства оценки наибольшего правдоподобия μ и σ 2 для нормального распределения, соответственно,
и
демонстрационное среднее значение для выборок x 1, x 2, …, x n. Демонстрационное среднее значение является несмещенным средством оценки параметра μ. Однако s 2MLE является смещенной оценкой параметра σ 2, означая, что его ожидаемое значение не равняется параметру.
Минимальное отклонение несмещенное средство оценки (MVUE) обычно используется, чтобы оценить параметры нормального распределения. MVUE является средством оценки, которое имеет минимальное отклонение всех несмещенных средств оценки параметра. MVUEs параметров μ и σ 2 для нормального распределения является демонстрационный средний x̄ и демонстрационное отклонение s 2, соответственно.
Чтобы соответствовать нормальному распределению к данным и найти оценки параметра, используйте normfit
, fitdist
или mle
.
Для не прошедших цензуру данных normfit
и fitdist
находят объективные оценки, и mle
находит оценки наибольшего правдоподобия.
Для подвергнутых цензуре данных normfit
, fitdist
и mle
находят оценки наибольшего правдоподобия.
В отличие от normfit
и mle
, который оценивает возвращаемый параметр, fitdist
возвращает подходящий объект NormalDistribution
распределения вероятностей. Свойства объектов mu
и sigma
хранят оценки параметра.
Для примера сочтите целесообразным Объект Нормального распределения.
Нормальная функция плотности вероятности (PDF)
Функцией правдоподобия является PDF, просматриваемый как функция параметров. Оценки наибольшего правдоподобия (MLEs) являются оценками параметра, которые максимизируют функцию правдоподобия для фиксированных значений x
.
Для примера смотрите, Вычисляют и График Нормальное распределение PDF.
Нормальная кумулятивная функция распределения (cdf)
p является вероятностью, что одно наблюдение от нормального распределения с параметрами μ и σ падает в интервале (-∞, x].
Стандартная нормальная кумулятивная функция распределения Φ (x) функционально связана с функцией ошибок erf
.
где
Для примера смотрите Нормальное распределение Стандарта Графика cdf
Загрузите выборочные данные и создайте вектор, содержащий первый столбец студенческих данных о классе экзамена.
load examgrades
x = grades(:,1);
Создайте объект нормального распределения путем подбора кривой ему к данным.
pd = fitdist(x,'Normal')
pd = NormalDistribution Normal distribution mu = 75.0083 [73.4321, 76.5846] sigma = 8.7202 [7.7391, 9.98843]
Интервалы рядом с оценками параметра составляют 95% доверительных интервалов для параметров распределения.
Вычислите PDF стандартного нормального распределения с параметрами равняйтесь 0 и равняйтесь 1.
x = [-3:.1:3]; y = normpdf(x,0,1);
Постройте PDF.
plot(x,y)
Создайте стандартный объект нормального распределения.
pd = makedist('Normal')
pd = NormalDistribution Normal distribution mu = 0 sigma = 1
Задайте значения x
и вычислите cdf.
x = -3:.1:3; p = cdf(pd,x);
Постройте cdf стандартного нормального распределения.
plot(x,p)
Гамма распределение имеет параметр формы и масштабный коэффициент . Для большого , гамма распределение тесно аппроксимирует нормальное распределение со средним значением и отклонение . Вычислите PDF гамма распределения с параметрами A = 100
и B = 10
. Для сравнения также вычислите PDF нормального распределения с параметрами mu = 1000
и sigma = 100
.
x = gaminv((0.005:0.01:0.995),100,10); y_gam = gampdf(x,100,10); y_norm = normpdf(x,1000,100);
Постройте pdfs гамма распределения и нормального распределения на той же фигуре.
plot(x,y_gam,'-',x,y_norm,'-.') title('Gamma and Normal pdfs') legend('Gamma Distribution','Normal Distribution')
Если X следует за логарифмически нормальным распределением с параметрами µ и σ, то регистрируйте (X), следует за нормальным распределением со средним значением µ и стандартное отклонение σ. Используйте объекты распределения, чтобы осмотреть отношение между нормальными и логарифмически нормальными дистрибутивами.
Создайте логарифмически нормальный объект распределения путем определения значений параметров.
pd = makedist('Lognormal','mu',5,'sigma',2)
pd = LognormalDistribution Lognormal distribution mu = 5 sigma = 2
Вычислите среднее значение логарифмически нормального распределения.
mean(pd)
ans = 1.0966e+03
Среднее значение логарифмически нормального распределения не равно параметру mu
. Среднее значение логарифмических значений равно mu
. Подтвердите это отношение путем генерации случайных чисел.
Сгенерируйте случайные числа от логарифмически нормального распределения и вычислите их логарифмические значения.
rng('default'); % For reproducibility x = random(pd,10000,1); logx = log(x);
Вычислите среднее значение логарифмических значений.
m = mean(logx)
m = 5.0033
Среднее значение журнала x
близко к параметру mu
x
, потому что x
имеет логарифмически нормальное распределение.
Создайте гистограмму logx
с подгонкой нормального распределения.
histfit(logx)
График показывает, что логарифмические значения x
нормально распределены.
histfit
использует fitdist
, чтобы соответствовать распределению к данным. Используйте fitdist
, чтобы получить параметры, используемые в подборе кривой.
pd_normal = fitdist(logx,'Normal')
pd_normal = NormalDistribution Normal distribution mu = 5.00332 [4.96445, 5.04219] sigma = 1.98296 [1.95585, 2.01083]
Предполагаемые параметры нормального распределения близко к логарифмически нормальным параметрам распределения 5 и 2.
T распределение Студента является семейством кривых в зависимости от одного параметра ν (степени свободы). Как степени свободы ν переходит к бесконечности, t распределение приближается к стандартному нормальному распределению. Вычислите pdfs для t распределения Студента с параметром nu = 5
и t распределение Студента с параметром nu = 25
. Вычислите PDF для стандартного нормального распределения.
x = -5:0.1:5; y1 = tpdf(x,5); y2 = tpdf(x,15); z = normpdf(x,0,1);
Постройте t Студента pdfs и стандартный нормальный PDF на той же фигуре. Стандартный нормальный PDF имеет более короткие хвосты, чем t Студента pdfs.
plot(x,y1,'-.',x,y2,'--',x,z,'-') legend('Student''s t Distribution with \nu=5', ... 'Student''s t Distribution with \nu=25', ... 'Standard Normal Distribution','Location','best') title('Student''s t and Standard Normal pdfs')
Биномиальное распределение — биномиальное распределение моделирует общее количество успехов в повторенных испытаниях n с вероятностью успеха p. Когда n увеличивается, биномиальное распределение может быть аппроксимировано нормальным распределением с µ = n p и σ 2 = n p (1–p).
Распределение Бирнбаума-Сондерса — Если x имеет распределение Бирнбаума-Сондерса с параметрами β и γ, то
имеет стандартное нормальное распределение.
Распределение хи-квадрат — распределение хи-квадрат является распределением суммы независимых, стандартных нормальных случайных переменных в квадрате. Если набор n наблюдений нормально распределен с отклонением σ 2, и s2 является демонстрационным отклонением, то (n –1) s 2/σ2 имеет распределение хи-квадрат с n –1 степень свободы. Функция normfit
использует это отношение, чтобы вычислить доверительные интервалы для оценки нормального параметра σ 2.
Распределение Экстремума — распределение экстремума подходит для моделирования наименьшего или самого большого значения от распределения, хвосты которого затухают экспоненциально быстро, такой как, нормальное распределение.
Гамма Распределение — гамма распределение имеет параметр формы a и масштабный коэффициент b. Для большого a гамма распределение тесно аппроксимирует нормальное распределение со средним μ = a b и отклонение σ 2 = a b 2. Гамма распределение имеет плотность только для положительных вещественных чисел. Смотрите Сравнивают Гамму и Нормальное распределение pdfs.
Полунормальное распределение — полунормальное распределение является особым случаем свернутых нормальных и усеченных нормальных распределений. Если случайная переменная Z
имеет стандартное нормальное распределение, то имеет полунормальное распределение с параметрами μ и σ.
Логистическое Распределение — логистическое распределение используется для моделей роста и в логистической регрессии. Это имеет более длинные хвосты и более высокий эксцесс, чем нормальное распределение.
Логарифмически нормальное Распределение — Если X следует за логарифмически нормальным распределением с параметрами µ и σ, то регистрируйте (X), следует за нормальным распределением со средним µ и стандартным отклонением σ. Смотрите Отношение Между Нормальными и Логарифмически нормальными Дистрибутивами.
Многомерное Нормальное распределение — многомерное нормальное распределение является обобщением одномерного нормального к двум или больше переменным. Это - распределение для случайных векторов коррелированых переменных, в которых каждый элемент имеет одномерное нормальное распределение. В самом простом случае среди переменных нет никакой корреляции, и элементы векторов являются независимыми, одномерными нормальными случайными переменными.
Распределение Пуассона — распределение Пуассона является дискретным распределением с одним параметром, которое принимает неотрицательные целочисленные значения. Параметр, λ, является и средним значением и отклонением распределения. Как увеличение λ, распределение Пуассона может быть аппроксимировано нормальным распределением с µ = λ и σ 2 = λ.
Распределение Релея — Распределение Релея является особым случаем распределения Weibull с приложениями в коммуникационной теории. Если скорости компонента частицы в направлениях X и Y являются двумя независимыми нормальными случайными переменными с нулевыми средними значениями и равняются отклонениям, то расстояние перемещения частицы в единицу времени следует за Распределением Релея.
Стабильное Распределение — нормальное распределение является особым случаем стабильного распределения. Стабильное распределение с первым параметром формы α = 2 соответствует нормальному распределению.
T Распределение студента — распределение t Студента является семейством кривых в зависимости от одного параметра ν (степени свободы). Как степени свободы ν переходит к бесконечности, распределение t приближается к стандартному нормальному распределению. Смотрите Сравнивают t Студента и Нормальное распределение pdfs.
Если x является случайной выборкой размера n от нормального распределения со средним μ, то статистическая величина
где демонстрационное среднее значение, и s является демонстрационным стандартным отклонением, имеет распределение t Студента с n –1 степень свободы.
t Распределение Шкалы Местоположения — t распределение шкалы местоположения полезно для моделирования дистрибутивов данных с более тяжелыми хвостами (более подверженный выбросам), чем нормальное распределение. Это приближается к нормальному распределению как к параметру формы ν бесконечность подходов.
[1] Abramowitz, M. и я. А. Стегун. Руководство математических функций. Нью-Йорк: Дувр, 1964.
[2] Эванс, M., Н. Гастингс и Б. Пикок. Статистические Дистрибутивы. 2-й редактор Хобокен, NJ: John Wiley & Sons, Inc., 1993.
[3] Беззаконный, J. F. Статистические модели и методы для пожизненных данных. Хобокен, NJ: Wiley-межнаука, 1982.
[4] Marsaglia, G. и В. В. Цанг. “Быстрый, Легко Реализованный метод для Выборки от Уменьшения или Симметричных Одномодовых Функций плотности”. SIAM Journal на Научном и Статистическом Вычислении. Издание 5, Номер 2, 1984, стр 349–359.
[5] Более кроткий, W. Q. и Л. А. Эскобар. Статистические методы для данных о надежности. Хобокен, NJ: John Wiley & Sons, Inc., 1998.
NormalDistribution
| erf
| normcdf
| normfit
| norminv
| normlike
| normpdf
| normrnd
| normstat