Этот пример показывает аппроксимацию объектов распределения вероятностей к сгруппированным выборочным данным и создание графика для визуального сравнения PDF каждой группы.
Загрузите выборочные данные.
load carsmall;
Данные содержат мили на галлон (MPG
) измерения для различных марок и моделей автомобилей, сгруппированные по странам источника (Origin
), модельного года (Model_Year
), и другие характеристики транспортного средства.
Преобразование Origin
в категориальный массив.
Origin = categorical(cellstr(Origin));
Использование fitdist
для соответствия ядерным распределениям для каждой группы стран источника в MPG
данные.
[KerByOrig,Country] = fitdist(MPG,'Kernel','by',Origin)
KerByOrig=1×6 cell array
Columns 1 through 2
{1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}
Columns 3 through 4
{1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}
Columns 5 through 6
{1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}
Country = 6x1 cell
{'France' }
{'Germany'}
{'Italy' }
{'Japan' }
{'Sweden' }
{'USA' }
Массив ячеек KerByOrig
содержит шесть объектов ядерного распределения, по одному для каждой страны, представленной в выборочных данных. Каждый объект содержит свойства, которые содержат информацию о данных, распределении и параметрах. Область массива Country
перечисляет страну источника для каждой группы в том же порядке, в котором хранятся объекты распределения KerByOrig
.
Извлеките объекты распределения вероятностей для Германии, Японии и США. Использовать позиции каждой страны в KerByOrig
показано на шаге 3, который указывает, что Германия является второй страной, Япония - четвертой страной, а США - шестой страной. Рассчитать PDF для каждой группы.
Germany = KerByOrig{2}; Japan = KerByOrig{4}; USA = KerByOrig{6}; x = 0:1:50; USA_pdf = pdf(USA,x); Japan_pdf = pdf(Japan,x); Germany_pdf = pdf(Germany,x);
Постройте график PDF для каждой группы на одном рисунке.
plot(x,USA_pdf,'r-') hold on plot(x,Japan_pdf,'b-.') plot(x,Germany_pdf,'k:') legend({'USA','Japan','Germany'},'Location','NW') title('MPG by Country of Origin') xlabel('MPG')
Получившийся график показывает, как мили на галлон (MPG
) эффективность отличается в зависимости от страны источника (Origin
). Используя эти данные, США имеют самое широкое распределение, а его пик находится на самом низком MPG
значение трёх источников. Япония имеет самое регулярное распределение с немного более тяжелым левым хвостом, а её пик на самом высоком MPG
значение трёх источников. Пик для Германии находится между США и Японией, и второй отбойник около 44 миль на галлон предполагает, что в данных может быть несколько режимов.