exponenta event banner

Подгонка распределений по сгруппированным данным с помощью ksdensity

В этом примере показано, как подгонять распределения ядра к сгруппированным данным образца с помощью ksdensity функция.

Шаг 1. Загрузить данные образца.

Загрузите образцы данных.

load carsmall

Данные содержат мили на галлон (MPG) измерения для различных марок и моделей автомобилей, сгруппированных по стране происхождения (Origin), модельный год (Model_Year) и другие характеристики транспортного средства.

Шаг 2. Группировать данные выборки по происхождению.

Группировать MPG данные по происхождению (Origin) для автомобилей, изготовленных в США, Японии и Германии.

Origin = categorical(cellstr(Origin));
MPG_USA = MPG(Origin=='USA');
MPG_Japan = MPG(Origin=='Japan');
MPG_Germany = MPG(Origin=='Germany');

Шаг 3. Вычислите и распечатайте pdf.

Вычислите и распечатайте pdf для каждой группы.

[fi,xi] = ksdensity(MPG_USA);
plot(xi,fi,'r-')
hold on

[fj,xj] = ksdensity(MPG_Japan);
plot(xj,fj,'b-.')

[fk,xk] = ksdensity(MPG_Germany);
plot(xk,fk,'k:')

legend('USA','Japan','Germany')
title('MPG by Origin')
xlabel('MPG')
hold off

Figure contains an axes. The axes with title MPG by Origin contains 3 objects of type line. These objects represent USA, Japan, Germany.

На графике показано, как мили на галлон (MPG) различается в зависимости от страны происхождения (Origin). Используя эти данные, США имеют самое широкое распространение, а его пик находится на самом низком MPG значение трех источников. Япония имеет самое регулярное распространение с немного более тяжелым левым хвостом, и его пик находится на самом высоком уровне MPG значение трех источников. Пик для Германии - между США и Японией, и второй удар около 44 миль на галлон говорит о том, что в данных может быть несколько режимов.

См. также

| |

Связанные темы