Подгонка распределений к сгруппированным данным с помощью ksdensity

В этом примере показано, как подогнать ядерные распределения к сгруппированным выборочным данным с помощью ksdensity функция.

Шаг 1. Загрузите выборочные данные.

Загрузите выборочные данные.

load carsmall

Данные содержат мили на галлон (MPG) измерения для различных марок и моделей автомобилей, сгруппированные по странам источника (Origin), модельного года (Model_Year), и другие характеристики транспортного средства.

Шаг 2. Сгруппировать выборочные данные по происхождению.

Сгруппировать MPG данные по происхождению (Origin) для автомобилей, произведенных в США, Японии и Германии.

Origin = categorical(cellstr(Origin));
MPG_USA = MPG(Origin=='USA');
MPG_Japan = MPG(Origin=='Japan');
MPG_Germany = MPG(Origin=='Germany');

Шаг 3. Вычислите и постройте график PDF.

Вычислите и постройте график PDF для каждой группы.

[fi,xi] = ksdensity(MPG_USA);
plot(xi,fi,'r-')
hold on

[fj,xj] = ksdensity(MPG_Japan);
plot(xj,fj,'b-.')

[fk,xk] = ksdensity(MPG_Germany);
plot(xk,fk,'k:')

legend('USA','Japan','Germany')
title('MPG by Origin')
xlabel('MPG')
hold off

Figure contains an axes. The axes with title MPG by Origin contains 3 objects of type line. These objects represent USA, Japan, Germany.

График показывает, как мили на галлон (MPG) эффективность отличается в зависимости от страны источника (Origin). Используя эти данные, США имеют самое широкое распределение, а его пик находится на самом низком MPG значение трёх источников. Япония имеет самое регулярное распределение с немного более тяжелым левым хвостом, а её пик на самом высоком MPG значение трёх источников. Пик для Германии находится между США и Японией, и второй отбойник около 44 миль на галлон предполагает, что в данных может быть несколько режимов.

См. также

| |

Похожие темы