Подходящие Дистрибутивы к Сгруппированным Данным Используя ksdensity

Этот пример показывает, как соответствовать дистрибутивам ядра к сгруппированным выборочным данным с помощью функции ksdensity.

Шаг 1. Загрузка демонстрационных данных.

Загрузите выборочные данные.

load carsmall

Данные содержат мили на галлон (MPG), измерения для различного делают и модели автомобилей, сгруппированных страной происхождения (Origin), модельный год (Model_Year) и другие характеристики автомобиля.

Шаг 2. Выборочные данные группы источником.

Сгруппируйте данные MPG источником (Origin) для автомобилей, сделанных в США, Японии и Германии.

Origin = categorical(cellstr(Origin));
MPG_USA = MPG(Origin=='USA');
MPG_Japan = MPG(Origin=='Japan');
MPG_Germany = MPG(Origin=='Germany');

Шаг 3. Вычислите и постройте PDF.

Вычислите и постройте PDF для каждой группы.

[fi,xi] = ksdensity(MPG_USA);
plot(xi,fi,'r-')
hold on

[fj,xj] = ksdensity(MPG_Japan);
plot(xj,fj,'b-.')

[fk,xk] = ksdensity(MPG_Germany);
plot(xk,fk,'k:')

legend('USA','Japan','Germany')
title('MPG by Origin')
xlabel('MPG')
hold off

График показывает, как мили на галлон (MPG) производительность отличаются страной происхождения (Origin). Используя эти данные, США имеют самое широкое распределение, и его пик в самом низком значении MPG этих трех источников. Япония имеет самое регулярное распределение с немного более тяжелым левым хвостом, и его пик в самом высоком значении MPG этих трех источников. Пик для Германии между США и Японией, и второй удар около 44 миль за галлон предполагает, что может быть несколько режимов в данных.

Документация