Подбор объектов распределения вероятностей к сгруппированным данным

Этот пример показывает аппроксимацию объектов распределения вероятностей к сгруппированным выборочным данным и создание графика для визуального сравнения PDF каждой группы.

Шаг 1. Загрузите выборочные данные.

Загрузите выборочные данные.

load carsmall;

Данные содержат мили на галлон (MPG) измерения для различных марок и моделей автомобилей, сгруппированные по странам источника (Origin), модельного года (Model_Year), и другие характеристики транспортного средства.

Шаг 2. Создайте категориальный массив.

Преобразование Origin в категориальный массив.

Origin = categorical(cellstr(Origin));

Шаг 3. Подгонка ядерных распределений к каждой группе.

Использование fitdist для соответствия ядерным распределениям для каждой группы стран источника в MPG данные.

[KerByOrig,Country] = fitdist(MPG,'Kernel','by',Origin)
KerByOrig=1×6 cell array
  Columns 1 through 2

    {1x1 prob.KernelDistribution}    {1x1 prob.KernelDistribution}

  Columns 3 through 4

    {1x1 prob.KernelDistribution}    {1x1 prob.KernelDistribution}

  Columns 5 through 6

    {1x1 prob.KernelDistribution}    {1x1 prob.KernelDistribution}

Country = 6x1 cell
    {'France' }
    {'Germany'}
    {'Italy'  }
    {'Japan'  }
    {'Sweden' }
    {'USA'    }

Массив ячеек KerByOrig содержит шесть объектов ядерного распределения, по одному для каждой страны, представленной в выборочных данных. Каждый объект содержит свойства, которые содержат информацию о данных, распределении и параметрах. Область массива Country перечисляет страну источника для каждой группы в том же порядке, в котором хранятся объекты распределения KerByOrig.

Шаг 4. Рассчитать PDF для каждой группы.

Извлеките объекты распределения вероятностей для Германии, Японии и США. Использовать позиции каждой страны в KerByOrig показано на шаге 3, который указывает, что Германия является второй страной, Япония - четвертой страной, а США - шестой страной. Рассчитать PDF для каждой группы.

Germany = KerByOrig{2};
Japan = KerByOrig{4};
USA = KerByOrig{6};

x = 0:1:50;

USA_pdf = pdf(USA,x);
Japan_pdf = pdf(Japan,x);
Germany_pdf = pdf(Germany,x);

Шаг 5. Постройте график PDF для каждой группы.

Постройте график PDF для каждой группы на одном рисунке.

plot(x,USA_pdf,'r-')
hold on
plot(x,Japan_pdf,'b-.')
plot(x,Germany_pdf,'k:')
legend({'USA','Japan','Germany'},'Location','NW')
title('MPG by Country of Origin')
xlabel('MPG')

Figure contains an axes. The axes with title MPG by Country of Origin contains 3 objects of type line. These objects represent USA, Japan, Germany.

Получившийся график показывает, как мили на галлон (MPG) эффективность отличается в зависимости от страны источника (Origin). Используя эти данные, США имеют самое широкое распределение, а его пик находится на самом низком MPG значение трёх источников. Япония имеет самое регулярное распределение с немного более тяжелым левым хвостом, а её пик на самом высоком MPG значение трёх источников. Пик для Германии находится между США и Японией, и второй отбойник около 44 миль на галлон предполагает, что в данных может быть несколько режимов.

См. также

|

Похожие темы