probplot

Графики вероятности

Синтаксис

probplot(y)
probplot(y,cens)
probplot(y,cens,freq)
probplot(dist,___)
probplot(ax,___)
probplot(ax,pd)
probplot(ax,fun,params)
probplot(___,'noref')
h = probplot(___)

Описание

пример

probplot(y) создает график нормального распределения, сравнивающий распределение данных в y к нормальному распределению.

probplot строит каждую точку данных в y с помощью символов маркера и проводит ссылочную линию, которая представляет теоретическое распределение. Если выборочные данные имеют нормальное распределение, то точки данных появляются вдоль ссылочной строки. Ссылочная строка соединяет первые и третьи квартили данных и расширяет к концам данных. Распределение кроме нормального вводит искривление в графике данных.

probplot(y,cens) создает график вероятности с помощью данных о цензурировании в cens.

пример

probplot(y,cens,freq) создает график вероятности с помощью данных о цензурировании в cens и данных о частоте в freq.

пример

probplot(dist,___) создает график вероятности для распределения, заданного dist, с помощью любого из входных параметров в предыдущих синтаксисах.

probplot(ax,___) добавляет график вероятности в существующие оси графика вероятности, заданные ax, с помощью любого из входных параметров в предыдущих синтаксисах.

probplot(ax,pd) добавляет подходящая строка на существующих осях графика вероятности, заданных ax, чтобы представлять распределение вероятностей pd.

пример

probplot(ax,fun,params) добавляет подходящая строка на существующих осях графика вероятности, заданных ax, чтобы представлять функциональный fun с параметрами params.

probplot(___,'noref') не использует ссылочную строку из графика.

пример

h = probplot(___) возвращает графические указатели, соответствующие построенным графикам.

Примеры

свернуть все

Сгенерируйте выборочные данные и создайте график вероятности.

Сгенерируйте выборочные данные. Демонстрационный x1 содержит 500 случайных чисел от распределения Weibull с масштабным коэффициентом A = 3 и параметр формы B = 3. Демонстрационный x2 содержит 500 случайных чисел от Распределения Релея с масштабным коэффициентом B = 3.

rng('default');  % For reproducibility
x1 = wblrnd(3,3,[500,1]);
x2 = raylrnd(3,[500,1]);

Создайте график вероятности оценить, прибывают ли данные в x1 и x2 из распределения Weibull.

figure
probplot('weibull',[x1 x2])
legend('Weibull Sample','Rayleigh Sample','Location','best')

График вероятности показывает, что данные в x1 прибывают из распределения Weibull, в то время как данные в x2 не делают.

Также можно использовать wblplot, чтобы создать график вероятности Weibull.

Создайте график вероятности и дополнительную подходящую строку на той же фигуре.

Сгенерируйте выборочные данные, содержащие приблизительно 20% выбросов в хвостах. Левый хвост выборочных данных содержит 10 значений, случайным образом сгенерированных от экспоненциального распределения с параметром mu = 1. Правый хвост содержит 10 значений, случайным образом сгенерированных от экспоненциального распределения с параметром mu = 5. Центр выборочных данных содержит 80 значений, случайным образом сгенерированных от стандартного нормального распределения.

rng('default')  % For reproducibility
left_tail = -exprnd(1,10,1);
right_tail = exprnd(5,10,1);
center = randn(80,1);
data = [left_tail;center;right_tail];

Создайте график вероятности оценить, прибывают ли выборочные данные из нормального распределения.

probplot(data)

Постройте t кривую шкалы местоположения на той же фигуре, чтобы соответствовать data.

p = mle(data,'distribution','tLocationScale');
t = @(data,mu,sig,df)cdf('tLocationScale',data,mu,sig,df);
h = probplot(gca,t,p);
h.Color = 'r';
h.LineStyle = '-';
title('{\bf Probability Plot}')
legend('Normal','Data','t','Location','NW')

График показывает, что ни нормальная строка, ни t кривая шкалы местоположения не соответствуют хвостам очень хорошо из-за выбросов.

Создайте график полунормального распределения вероятностей идентифицировать значительные эффекты в эксперименте, чтобы изучить факторы, которые могут влиять на скорость потока жидкости в химическом производственном процессе. Этими четырьмя факторами являются реагенты A, B, C и D. Каждый фактор присутствует на двух уровнях (высокая и низкая концентрация). Эксперимент содержит только одну репликацию на каждом факторном уровне.

Загрузите выборочные данные.

load flowrate

Первые четыре столбца таблицы flowrate содержат матрицу проекта для факторов и их взаимодействий. Матрица проекта закодирована, чтобы использовать 1 для высокого факторного уровня и -1 для низкого факторного уровня. Пятая колонна flowrate содержит измеренную скорость потока жидкости.

Соответствуйте модели линейной регрессии использование rate как переменная отклика. Используйте переменные прогноза A, B, C, D и все их периоды взаимодействия.

mdl = fitlm(flowrate,'rate ~ A*B*C*D');

Вычислите и сохраните абсолютное значение факторных оценок эффекта. Чтобы получить факторные оценки эффекта, умножьте содействующие оценки, полученные во время модели, соответствующей на два. Этот шаг необходим, потому что коэффициенты регрессии измеряют эффект изменения с одним модулем в x на среднем значении y. Однако оценки эффектов измеряют 2D модульное изменение в x из-за матричного кодирования проекта-1 и 1. Исключите базовое измерение. Обратите внимание на то, что факторный порядок в mdl может отличаться от порядка в матрице первоначального проекта.

effects = abs(mdl.Coefficients{2:end,1}*2);

Создайте полуграфик нормального распределения с помощью абсолютного значения оценок эффектов, исключая базовую линию.

figure
h = probplot('halfnormal',effects);

Маркируйте точки и отформатируйте график. Во-первых, возвратите индексные значения для отсортированных оценок эффектов (от самого низкого до самого высокого). Затем используйте эти индексные значения, чтобы отсортировать значения вероятности, сохраненные в графическом указателе (h(1).YData).

[b,i] = sort(effects);
prob(i) = h(1).YData;

Добавьте текстовые метки в график в каждой точке. Для каждой точки x-значение является оценкой эффектов, и y-значение является соответствующей вероятностью.

text(effects,prob,mdl.CoefficientNames(2:end),'FontSize',8,...
    'VerticalAlignment','top')
h(1).Color = 'r';

Точки, расположенные далекий от ссылочной строки, представляют значительные эффекты.

Сгенерируйте моделируемые данные о частоте.

y = 1:10;
freq = [2 4 6 7 9 8 7 7 6 5];

Создайте график нормального распределения с помощью данных о частоте.

probplot(y,[],freq)

График нормального распределения показывает, что данные не имеют нормального распределения.

Входные параметры

свернуть все

Выборочные данные, заданные как числовая векторная или числовая матрица. probplot отображает каждое значение в y с помощью символов маркера включая 'x' и 'o'. Если y является матрицей, то probplot отображает отдельную строку для каждого столбца y.

Не все дистрибутивы подходят для всех наборов данных. ошибки probplot, если набор данных является несоответствующим для заданного распределения. Смотрите dist для соответствующих областей значений данных для каждого распределения.

Распределение для графика вероятности, заданного как распределение вероятностей, возражает или одно из следующих имен распределения:

ИмяПостройте типDataRange
'normal'График нормального распределенияВсе значения
'exponential'Экспоненциальный график вероятностиНеотрицательные значения
'extreme value'График вероятности экстремумаВсе значения
'half normal'Полуграфик нормального распределенияВсе значения
'lognormal'Логарифмически нормальный график вероятностиПоложительные значения
'logistic'Логистический график вероятностиВсе значения
'loglogistic'График вероятности LoglogisticПоложительные значения
'rayleigh'Рэлеевский график вероятностиПоложительные значения
'weibull'График вероятности WeibullПоложительные значения

Значением по умолчанию является 'normal', если вы создаете график вероятности в новой фигуре. Если вы добавляете график вероятности в фигуру, которая уже включает один при помощи входного параметра ax, то значением по умолчанию является тип графика существующего графика вероятности.

Можно создать объект распределения вероятностей с заданными значениями параметров с помощью makedist. Также соответствуйте объекту распределения вероятностей к выборочным данным с помощью fitdist. Для получения дополнительной информации об объектах распределения вероятностей смотрите Работу с Распределениями вероятностей.

y - шкала оси основана на выбранном распределении. x - ось имеет логарифмическую шкалу для Weibull, loglogistic, и логарифмически нормальные дистрибутивы и линейную шкалу для других.

Не все дистрибутивы подходят для всех наборов данных. ошибки probplot, если набор данных является несоответствующим для заданного распределения.

Пример: 'weibull'

Цензурирование данных, заданных как числовой вектор. cens должен быть той же длиной как y и содержать значение 1 для наблюдений, которые подвергаются цензуре правом и значение 0 для наблюдений, которые измеряются точно.

Типы данных: single | double

Данные о частоте, заданные как вектор целочисленных значений. freq должен быть той же длиной как y. freq содержит целочисленные частоты для соответствующих элементов в y.

Чтобы создать вероятность отображают данные о частоте использования на графике, но не цензурирование данных, задайте пустые скобки ([]) для cens.

Типы данных: single | double

Целевые оси, заданные как объект Axes или объект UIAxes. probplot добавляет дополнительный график в оси, заданные ax. Для получения дополнительной информации смотрите Axes Properties and UIAxes Properties.

Используйте gca, чтобы возвратить текущую систему координат для текущей фигуры.

Распределение вероятностей для ссылочной строки, заданной как объект распределения вероятностей. probplot добавляет подходящую строку в оси, заданные ax, чтобы представлять распределение вероятностей, заданное pd.

Создайте объект распределения вероятностей с заданными значениями параметров с помощью makedist. Также соответствуйте объекту распределения вероятностей к выборочным данным с помощью fitdist. Для получения дополнительной информации об объектах распределения вероятностей смотрите Работу с Распределениями вероятностей.

Функция для ссылочной строки, заданной как указатель на функцию. probplot добавляет подходящую строку в оси, заданные ax, чтобы представлять функцию, заданную fun, оцененным в параметрах, заданных params.

fun является указателем на функцию к функции cdf, заданное использование оператора указателя на функцию @. Функция должна принять вектор входных значений в качестве его первого аргумента и возвратить вектор, содержащий cdf, оцененный в каждом входном значении. Задайте значения параметров, требуемые оценивать fun с помощью аргумента params. Для получения дополнительной информации об указателях на функцию см. Создание указателя на функцию (MATLAB).

Пример: @wblpdf

Типы данных: function_handle

Ссылочные параметры функции строки, заданные как вектор числовых значений или массива ячеек. probplot добавляет подходящую строку в оси, заданные ax, чтобы представлять функцию, заданную fun, оцененным в параметрах, заданных params.

fun является указателем на функцию к функции cdf, заданное использование оператора указателя на функцию @. Функция должна принять вектор значений в качестве его первого аргумента и возвратить вектор cdf значений, оцененных в каждом значении. Задайте значения параметров, требуемые оценивать fun с помощью аргумента params. Для получения дополнительной информации об указателях на функцию см. Создание указателя на функцию (MATLAB).

Выходные аргументы

свернуть все

Графические указатели для объектов линии, возвращенных как вектор Строки графические указатели. Графические указатели являются уникальными идентификаторами, которые можно использовать, чтобы запросить и изменить свойства определенной строки на графике. Для каждого столбца y probplot возвращает два указателя:

  • Строка, представляющая точки данных. probplot представляет каждую точку данных в y с помощью символов маркера, таких как '+' и 'o'.

  • Строка, показывающая теоретическое распределение для графика вероятности, представленного как пунктирная линия.

Чтобы просмотреть и установить свойства объектов линии, используйте запись через точку. Для получения информации об использовании записи через точку см. Доступ к значениям свойств (MATLAB). Для получения информации о свойствах Line, которые можно установить, смотрите Line Properties.

Алгоритмы

probplot совпадает с квантилями выборочных данных к квантилям данного распределения вероятностей. Выборочные данные сортируются, масштабируются согласно выбору dist и строятся на оси X. Когда dist является 'lognormal', 'loglogistic' или 'weibull', масштабирование является логарифмическим. В противном случае масштабирование линейно. Ось Y представляет квантили распределения, заданного в dist, преобразованном в значения вероятности. Масштабирование зависит от данного распределения и не линейно.

Где значением оси X является i th отсортированное значение от выборки размера N, значение оси Y является средней точкой между точками оценки эмпирической кумулятивной функции распределения данных. В случае не прошедших цензуру данных средняя точка равна (i0.5)N.

probplot накладывает ссылочную строку, чтобы оценить линейность графика. Если данные являются не прошедшими цензуру, то строка проходит первые и третьи квартили данных. Если данные подвергаются цензуре, то строка переключает соответственно. Если данные являются не прошедшими цензуру, и dist является 'half normal', то probplot использует нулевые и вторые квартили вместо этого.

Представлено до R2006a