Подходящие распределения к сгруппированным данным Используя ksdensity

В этом примере показано, как соответствовать распределениям ядра к сгруппированным выборочным данным с помощью ksdensity функция.

Шаг 1. Загрузка демонстрационных данных.

Загрузите выборочные данные.

load carsmall

Данные содержат мили на галлон (MPG) измерения для различного делают и модели автомобилей, сгруппированных страной происхождения (Origin), модельный год (Model_Year), и другие характеристики транспортного средства.

Шаг 2. Выборочные данные группы источником.

Сгруппируйте MPG данные источником (Origin) для автомобилей, сделанных в США, Японии и Германии.

Origin = categorical(cellstr(Origin));
MPG_USA = MPG(Origin=='USA');
MPG_Japan = MPG(Origin=='Japan');
MPG_Germany = MPG(Origin=='Germany');

Шаг 3. Вычислите и постройте PDF.

Вычислите и постройте PDF для каждой группы.

[fi,xi] = ksdensity(MPG_USA);
plot(xi,fi,'r-')
hold on

[fj,xj] = ksdensity(MPG_Japan);
plot(xj,fj,'b-.')

[fk,xk] = ksdensity(MPG_Germany);
plot(xk,fk,'k:')

legend('USA','Japan','Germany')
title('MPG by Origin')
xlabel('MPG')
hold off

График показывает как мили на галлон (MPG) производительность отличается страной происхождения (Origin). Используя эти данные, США имеют самое широкое распределение, и его пик в самом низком MPG значение этих трех источников. Япония имеет самое регулярное распределение с немного более тяжелым левым хвостом, и его пик в самом высоком MPG значение этих трех источников. Пик для Германии между США и Японией, и второй удар около 44 миль за галлон предполагает, что может быть несколько режимов в данных.

Смотрите также

| |

Похожие темы