fitdist

Подходящий объект вероятностного распределения к данным

Синтаксис

pd = fitdist(x,distname)

pd = fitdist(x,distname,Name,Value)

[pdca,gn,gl]
= fitdist(x,distname,'By',groupvar)

[pdca,gn,gl]
= fitdist(x,distname,'By',groupvar,Name,Value)

Описание

пример

pd = fitdist(x,distname) создает объект вероятностного распределения путем подбора кривой распределению, заданному distname к данным в вектор-столбце x.

пример

pd = fitdist(x,distname,Name,Value) создает объект вероятностного распределения с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно указать на подвергнутые цензуре данные или задать параметры управления для итеративного алгоритма подбора.

пример

[pdca,gn,gl] = fitdist(x,distname,'By',groupvar) создает объекты вероятностного распределения путем подбора кривой распределению, заданному distname к данным в x на основе сгруппированной переменной groupvar. Это возвращает массив ячеек подходящих объектов вероятностного распределения, pdca, массив ячеек меток группы, gn, и массив ячеек уровней сгруппированной переменной, gl.

пример

[pdca,gn,gl] = fitdist(x,distname,'By',groupvar,Name,Value) возвращает вышеупомянутые выходные аргументы с помощью дополнительных опций, заданных одним или несколькими аргументами пары "имя-значение". Например, можно указать на подвергнутые цензуре данные или задать параметры управления для итеративного алгоритма подбора.

Примеры

свернуть все

Соответствуйте нормальному распределению к данным

Скрипт Open Live Script

Загрузите выборочные данные. Создайте вектор, содержащий данные о весе пациентов.

load hospital
x = hospital.Weight;

Создайте объект нормального распределения путем подбора кривой ему к данным.

pd = fitdist(x,'Normal')

pd = 
  NormalDistribution

  Normal distribution
       mu =     154   [148.728, 159.272]
    sigma = 26.5714   [23.3299, 30.8674]

Интервалы рядом с оценками параметра составляют 95% доверительных интервалов для параметров распределения.

Постройте PDF распределения.

x_values = 50:1:250;
y = pdf(pd,x_values);
plot(x_values,y,'LineWidth',2)

Соответствуйте распределению ядра к данным

Скрипт Open Live Script

Загрузите выборочные данные. Создайте вектор, содержащий данные о весе пациентов.

load hospital
x = hospital.Weight;

Создайте объект распределения ядра путем подбора кривой ему к данным. Используйте функцию ядра Епанечникова.

pd = fitdist(x,'Kernel','Kernel','epanechnikov')

pd = 
  KernelDistribution

    Kernel = epanechnikov
    Bandwidth = 14.3792
    Support = unbounded

Постройте PDF распределения.

x_values = 50:1:250;
y = pdf(pd,x_values);
plot(x_values,y)

Подходящие нормальные распределения к сгруппированным данным

Скрипт Open Live Script

Загрузите выборочные данные. Создайте вектор, содержащий данные о весе пациентов.

load hospital
x = hospital.Weight;

Создайте объекты нормального распределения путем подбора кривой им к данным, сгруппированным терпеливым полом.

gender = hospital.Sex;
[pdca,gn,gl] = fitdist(x,'Normal','By',gender)

pdca=1×2 cell
    {1x1 prob.NormalDistribution}    {1x1 prob.NormalDistribution}

gn = 2x1 cell array
    {'Female'}
    {'Male'  }

gl = 2x1 cell array
    {'Female'}
    {'Male'  }

Массив ячеек pdca содержит два объекта вероятностного распределения, один для каждой гендерной группы. Массив ячеек gn содержит две метки группы. Массив ячеек gl содержит два уровня группы.

Просмотрите каждое распределение в массиве ячеек pdca сравнить среднее значение, mu, и стандартное отклонение, sigma, сгруппированный терпеливым полом.

female = pdca{1}  % Distribution for females

female = 
  NormalDistribution

  Normal distribution
       mu = 130.472   [128.183, 132.76]
    sigma = 8.30339   [6.96947, 10.2736]

male = pdca{2}  % Distribution for males

male = 
  NormalDistribution

  Normal distribution
       mu = 180.532   [177.833, 183.231]
    sigma = 9.19322   [7.63933, 11.5466]

Вычислите PDF каждого распределения.

x_values = 50:1:250;
femalepdf = pdf(female,x_values);
malepdf = pdf(male,x_values);

Постройте pdfs для визуального сравнения распределения веса полом.

figure
plot(x_values,femalepdf,'LineWidth',2)
hold on
plot(x_values,malepdf,'Color','r','LineStyle',':','LineWidth',2)
legend(gn,'Location','NorthEast')
hold off

Подходящие распределения ядра к сгруппированным данным

Скрипт Open Live Script

Загрузите выборочные данные. Создайте вектор, содержащий данные о весе пациентов.

load hospital
x = hospital.Weight;

Создайте объекты распределения ядра путем подбора кривой им к данным, сгруппированным терпеливым полом. Используйте треугольную функцию ядра.

gender = hospital.Sex;
[pdca,gn,gl] = fitdist(x,'Kernel','By',gender,'Kernel','triangle');

Просмотрите каждое распределение в массиве ячеек pdca видеть распределения ядра для каждого пола.

female = pdca{1}  % Distribution for females

female = 
  KernelDistribution

    Kernel = triangle
    Bandwidth = 4.25894
    Support = unbounded

male = pdca{2}  % Distribution for males

male = 
  KernelDistribution

    Kernel = triangle
    Bandwidth = 5.08961
    Support = unbounded

Вычислите PDF каждого распределения.

x_values = 50:1:250;
femalepdf = pdf(female,x_values);
malepdf = pdf(male,x_values);

Постройте pdfs для визуального сравнения распределения веса полом.

figure
plot(x_values,femalepdf,'LineWidth',2)
hold on
plot(x_values,malepdf,'Color','r','LineStyle',':','LineWidth',2)
legend(gn,'Location','NorthEast')
hold off

Входные параметры

свернуть все

`x` — Входные данные
вектор-столбец

Входные данные, заданные как вектор-столбец. fitdist игнорирует NaN значения в x. Кроме того, любой NaN значения в векторе цензурирования или векторе частоты вызывают fitdist проигнорировать соответствующие значения в x.

Типы данных: double

`distname` — Имя распределения
вектор символов | представляет скаляр в виде строки

Имя распределения, заданное как один из следующих векторов символов или скаляров строки. Распределение задано distname определяет тип возвращенного объекта вероятностного распределения.

Имя распределения	Описание	Объект распределения
`'Beta'`	Бета распределение	`BetaDistribution`
`'Binomial'`	Биномиальное распределение	`BinomialDistribution`
`'BirnbaumSaunders'`	Распределение Бирнбаума-Сондерса	`BirnbaumSaundersDistribution`
`'Burr'`	Подпилите распределение	`BurrDistribution`
`'Exponential'`	Экспоненциальное распределение	`ExponentialDistribution`
`'ExtremeValue'`	Распределение Экстремума	`ExtremeValueDistribution`
`'Gamma'`	Гамма распределение	`GammaDistribution`
`'GeneralizedExtremeValue'`	Обобщенное распределение Экстремума	`GeneralizedExtremeValueDistribution`
`'GeneralizedPareto'`	Обобщенное распределение Парето	`GeneralizedParetoDistribution`
`'HalfNormal'`	Полунормальное распределение	`HalfNormalDistribution`
`'InverseGaussian'`	Обратное Распределение Гаусса	`InverseGaussianDistribution`
`'Kernel'`	Распределение ядра	`KernelDistribution`
`'Logistic'`	Логистическое распределение	`LogisticDistribution`
`'Loglogistic'`	Распределение Loglogistic	`LoglogisticDistribution`
`'Lognormal'`	Логарифмически нормальное распределение	`LognormalDistribution`
`'Nakagami'`	Распределение Nakagami	`NakagamiDistribution`
`'NegativeBinomial'`	Отрицательное Биномиальное распределение	`NegativeBinomialDistribution`
`'Normal'`	Нормальное распределение	`NormalDistribution`
`'Poisson'`	Распределение Пуассона	`PoissonDistribution`
`'Rayleigh'`	Распределение Релея	`RayleighDistribution`
`'Rician'`	Распределение Rician	`RicianDistribution`
`'Stable'`	Устойчивое распределение	`StableDistribution`
`'tLocationScale'`	Распределение Шкалы Местоположения t	`tLocationScaleDistribution`
`'Weibull'`	Распределение Weibull	`WeibullDistribution`

`groupvar` — Сгруппированная переменная
категориальный массив | логический или числовой вектор | символьный массив | массив строк | массив ячеек из символьных векторов

Сгруппированная переменная, заданная как категориальный массив, логический или числовой вектор, символьный массив, массив строк или массив ячеек из символьных векторов. Каждое уникальное значение в сгруппированной переменной задает группу.

Например, если Gender массив ячеек из символьных векторов со значениями 'Male' и 'Female', можно использовать Gender как сгруппированная переменная, чтобы соответствовать распределению к вашим данным полом.

Больше чем одна сгруппированная переменная может использоваться путем определения массива ячеек сгруппированных переменных. Наблюдения помещаются в ту же группу, если у них есть общие ценности всех заданных сгруппированных переменных.

Например, если Smoker логический вектор со значениями 0 для некурящих и 1 для курильщиков, затем задавая массив ячеек {Gender,Smoker} делит наблюдения на четыре группы: Штекерный Курильщик, Штекерный Некурящий, Курильщица и Женщина - некурящая.

Пример: {Gender,Smoker}

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: fitdist(x,'Kernel','Kernel','triangle') соответствует объекту распределения ядра к данным в x использование треугольной функции ядра.

`'Censoring'` — Логический флаг для подвергнутых цензуре данных
0 (значение по умолчанию) | вектор логических значений

Логический флаг для подвергнутых цензуре данных, заданных как разделенная запятой пара, состоящая из 'Censoring' и вектор логических значений, который одного размера с входным вектором x. Значением является 1 когда соответствующий элемент в x подвергнутое цензуре правом наблюдение и 0 когда соответствующий элемент является точным наблюдением. Значением по умолчанию является вектор 0s, указывая, что все наблюдения точны.

fitdist игнорирует любой NaN значения в этом векторе цензурирования. Кроме того, любой NaN значения в x или вектор частоты вызывает fitdist проигнорировать соответствующие значения в векторе цензурирования.

Этот аргумент допустим только если distname 'BirnbaumSaunders', 'Burr', 'Exponential', 'ExtremeValue'\Gamma, 'InverseGaussian', 'Kernel', 'Logistic', 'Loglogistic', 'Lognormal', 'Nakagami', 'Normal', 'Rician', 'tLocationScale', или 'Weibull'.

Типы данных: логический

`'Frequency'` — Частота наблюдения
1 (значение по умолчанию) | вектор неотрицательных целочисленных значений

Частота наблюдения, заданная как разделенная запятой пара, состоящая из 'Frequency' и вектор неотрицательных целочисленных значений, который одного размера с входным вектором x. Каждый элемент вектора частоты задает частоты для соответствующих элементов в x. Значением по умолчанию является вектор 1s, указывая, что каждое значение в x только появляется однажды.

fitdist игнорирует любой NaN значения в этом векторе частоты. Кроме того, любой NaN значения в x или вектор цензурирования вызывает fitdist проигнорировать соответствующие значения в векторе частоты.

Типы данных: single | double

`'Options'` — Управляйте параметрами
структура

Управляйте параметрами для итеративного алгоритма подбора, заданного как разделенная запятой пара, состоящая из 'Options' и структура вы создаете использование statset.

Типы данных: struct

`'NTrials'` — Количество испытаний
положительное целочисленное значение

Количество испытаний за биномиальное распределение, заданное как разделенная запятой пара, состоящая из 'NTrials' и положительное целочисленное значение. Необходимо задать distname как 'Binomial' использовать эту опцию.

Типы данных: single | double

`'Theta'` — Пороговый параметр
0 (значение по умолчанию) | скалярное значение

Пороговый параметр для обобщенного распределения Парето, заданного как разделенная запятой пара, состоящая из 'Theta' и скалярное значение. Необходимо задать distname как 'GeneralizedPareto' использовать эту опцию.

Типы данных: single | double

`'mu'` — Параметр положения
0 (значений по умолчанию) | скалярное значение

Параметр положения для полунормального распределения, заданного как разделенная запятой пара, состоящая из 'mu' и скалярное значение. Необходимо задать distname как 'HalfNormal' использовать эту опцию.

Типы данных: single | double

`'Kernel'` — Ядро более сглаженный тип
`'normal'` (значение по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'`

Ядро более сглаженный тип, заданный как разделенная запятой пара, состоящая из 'Kernel' и одно из следующего:

'normal'
'box'
'triangle'
'epanechnikov'

Необходимо задать distname как 'Kernel' использовать эту опцию.

`'Support'` — Поддержка плотности ядра
`'unbounded'` (значение по умолчанию) | `'positive'` | двухэлементный вектор

Поддержка плотности ядра, заданная как разделенная запятой пара, состоящая из 'Support' и 'unbounded', 'positive', или двухэлементный вектор.

`'unbounded'`	Плотность может расширить по целой действительной линии.
`'positive'`	Плотность ограничивается положительными значениями.

В качестве альтернативы можно задать двухэлементный вектор, дающий конечные нижние и верхние пределы для поддержки плотности.

Необходимо задать distname как 'Kernel' использовать эту опцию.

Типы данных: single | double | char | string

`'Width'` — Пропускная способность окна сглаживания ядра
скалярное значение

Пропускная способность окна сглаживания ядра, заданного как разделенная запятой пара, состоящая из 'Width' и скалярное значение. Значение по умолчанию используется fitdist оптимально для оценки нормальной плотности, но вы можете хотеть выбрать меньшее значение, чтобы показать функции, такие как несколько режимов. Необходимо задать distname как 'Kernel' использовать эту опцию.

Типы данных: single | double

Выходные аргументы

свернуть все

`pd` — Вероятностное распределение
объект вероятностного распределения

Вероятностное распределение, возвращенное как объект вероятностного распределения. Распределение задано distname определяет тип класса возвращенного объекта вероятностного распределения.

`pdca` — Объекты вероятностного распределения
cellArray

Объекты вероятностного распределения типа заданы distname, возвращенный как массив ячеек.

`gn` — Метки группы
массив ячеек из символьных векторов

Метки группы, возвращенные как массив ячеек из символьных векторов.

`gl` — Уровни сгруппированной переменной
массив ячеек из символьных векторов

Уровни сгруппированной переменной, возвращенные как массив ячеек из символьных векторов, содержащий один столбец для каждой сгруппированной переменной.

Алгоритмы

fitdist функционируйте соответствует большинству распределений с помощью оценки наибольшего правдоподобия. Двумя исключениями являются нормальные и логарифмически нормальные распределения с не прошедшими цензуру данными.

Для не прошедшего цензуру нормального распределения ориентировочная стоимость параметра сигмы является квадратным корнем из объективной оценки отклонения.
Для не прошедшего цензуру логарифмически нормального распределения ориентировочная стоимость параметра сигмы является квадратным корнем из объективной оценки отклонения журнала данных.

Альтернативная функциональность

Приложение

Приложение Distribution Fitter открывает графический интерфейс пользователя для вас, чтобы импортировать данные из рабочей области и в интерактивном режиме строить распределение вероятности к тем данным. Можно затем сохранить распределение в рабочую область как объект вероятностного распределения. Откройте приложение Distribution Fitter с помощью distributionFitter, или нажмите Distribution Fitter на вкладке Apps.

Ссылки

[1] Джонсон, N. L. С. Коц и Н. Бэлэкришнэн. Непрерывные одномерные распределения. Издание 1, Хобокен, NJ: Wiley-межнаука, 1993.

[2] Джонсон, N. L. С. Коц и Н. Бэлэкришнэн. Непрерывные одномерные распределения. Издание 2, Хобокен, NJ: Wiley-межнаука, 1994.

[3] Лучник, A. W. и А. Аццалини. Прикладные методы сглаживания для анализа данных. Нью-Йорк: Издательство Оксфордского университета, 1997.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

Поддерживаемые синтаксисы:
```
pd = fitdist(x,distname)
pd = fitdist(x,distname,Name,Value)
```
Генерация кода не поддерживает синтаксисы, которые включают сгруппированную переменную 'By',groupvar и связанные выходные аргументы pdca, gn, и gl.
fitdist генерация кода поддержек для беты, экспоненциала, экстремума, логарифмически нормального, нормального, и распределения Weibull.
- Значение distname может быть 'Beta', 'Exponential', 'ExtremeValue', 'Lognormal', 'Normal' или 'Weibull'.
- Значение distname должно быть постоянное время компиляции.
Значения x, 'Censoring', и 'Frequency' не должен содержать NaN значения.
Генерация кода игнорирует 'Frequency' значение для бета распределения. Вместо того, чтобы задать 'Frequency' значение, вручную добавьте дублированные значения в x так, чтобы значения в x имейте частоту, которую вы хотите.
Генерация кода не поддерживает эти входные параметры: groupvar, NTrials, Theta\mu, KernelПоддержка, и Width.
Имена в аргументах пары "имя-значение" должны быть константами времени компиляции.
Эти объектные функции pd генерация кода поддержки: cdf, icdfiqrсреднее значениемедиана, pdfстанд, truncate, и var.

Для получения дополнительной информации о генерации кода смотрите Введение в Генерацию кода и Генерацию кода для Объектов Распределения вероятностей.

Документация

fitdist

Синтаксис

Описание

Примеры

Соответствуйте нормальному распределению к данным

Соответствуйте распределению ядра к данным

Подходящие нормальные распределения к сгруппированным данным

Подходящие распределения ядра к сгруппированным данным

Входные параметры

`x` — Входные данные
вектор-столбец

`distname` — Имя распределения
вектор символов | представляет скаляр в виде строки

`groupvar` — Сгруппированная переменная
категориальный массив | логический или числовой вектор | символьный массив | массив строк | массив ячеек из символьных векторов

Аргументы в виде пар имя-значение

`'Censoring'` — Логический флаг для подвергнутых цензуре данных
0 (значение по умолчанию) | вектор логических значений

`'Frequency'` — Частота наблюдения
1 (значение по умолчанию) | вектор неотрицательных целочисленных значений

`'Options'` — Управляйте параметрами
структура

`'NTrials'` — Количество испытаний
положительное целочисленное значение

`'Theta'` — Пороговый параметр
0 (значение по умолчанию) | скалярное значение

`'mu'` — Параметр положения
0 (значений по умолчанию) | скалярное значение

`'Kernel'` — Ядро более сглаженный тип
`'normal'` (значение по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'`

`'Support'` — Поддержка плотности ядра
`'unbounded'` (значение по умолчанию) | `'positive'` | двухэлементный вектор

`'Width'` — Пропускная способность окна сглаживания ядра
скалярное значение

Выходные аргументы

`pd` — Вероятностное распределение
объект вероятностного распределения

`pdca` — Объекты вероятностного распределения
cellArray

`gn` — Метки группы
массив ячеек из символьных векторов

`gl` — Уровни сгруппированной переменной
массив ячеек из символьных векторов

Алгоритмы

Альтернативная функциональность

Приложение

Ссылки

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2009a

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

fitdist

Синтаксис

Описание

Примеры

Соответствуйте нормальному распределению к данным

Соответствуйте распределению ядра к данным

Подходящие нормальные распределения к сгруппированным данным

Подходящие распределения ядра к сгруппированным данным

Входные параметры

x — Входные данные вектор-столбец

distname — Имя распределения вектор символов | представляет скаляр в виде строки

groupvar — Сгруппированная переменная категориальный массив | логический или числовой вектор | символьный массив | массив строк | массив ячеек из символьных векторов

Аргументы в виде пар имя-значение

'Censoring' — Логический флаг для подвергнутых цензуре данных0 (значение по умолчанию) | вектор логических значений

'Frequency' — Частота наблюдения1 (значение по умолчанию) | вектор неотрицательных целочисленных значений

'Options' — Управляйте параметрами структура

'NTrials' — Количество испытаний положительное целочисленное значение

'Theta' — Пороговый параметр0 (значение по умолчанию) | скалярное значение

'mu' — Параметр положения 0 (значений по умолчанию) | скалярное значение

'Kernel' — Ядро более сглаженный тип 'normal' (значение по умолчанию) | 'box' | 'triangle' | 'epanechnikov'

'Support' — Поддержка плотности ядра 'unbounded' (значение по умолчанию) | 'positive' | двухэлементный вектор

'Width' — Пропускная способность окна сглаживания ядра скалярное значение

Выходные аргументы

pd — Вероятностное распределение объект вероятностного распределения

pdca — Объекты вероятностного распределения cellArray

gn — Метки группы массив ячеек из символьных векторов

gl — Уровни сгруппированной переменной массив ячеек из символьных векторов

Алгоритмы

Альтернативная функциональность

Приложение

Ссылки

Расширенные возможности

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2009a

Документация Statistics and Machine Learning Toolbox

Поддержка

`x` — Входные данные
вектор-столбец

`distname` — Имя распределения
вектор символов | представляет скаляр в виде строки

`groupvar` — Сгруппированная переменная
категориальный массив | логический или числовой вектор | символьный массив | массив строк | массив ячеек из символьных векторов

`'Censoring'` — Логический флаг для подвергнутых цензуре данных
0 (значение по умолчанию) | вектор логических значений

`'Frequency'` — Частота наблюдения
1 (значение по умолчанию) | вектор неотрицательных целочисленных значений

`'Options'` — Управляйте параметрами
структура

`'NTrials'` — Количество испытаний
положительное целочисленное значение

`'Theta'` — Пороговый параметр
0 (значение по умолчанию) | скалярное значение

`'mu'` — Параметр положения
0 (значений по умолчанию) | скалярное значение

`'Kernel'` — Ядро более сглаженный тип
`'normal'` (значение по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'`

`'Support'` — Поддержка плотности ядра
`'unbounded'` (значение по умолчанию) | `'positive'` | двухэлементный вектор

`'Width'` — Пропускная способность окна сглаживания ядра
скалярное значение

`pd` — Вероятностное распределение
объект вероятностного распределения

`pdca` — Объекты вероятностного распределения
cellArray

`gn` — Метки группы
массив ячеек из символьных векторов

`gl` — Уровни сгруппированной переменной
массив ячеек из символьных векторов

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.