Этот пример показывает, как соответствовать дистрибутивам ядра к сгруппированным выборочным данным с помощью функции ksdensity
.
Загрузите выборочные данные.
load carsmall
Данные содержат мили на галлон (MPG
), измерения для различного делают и модели автомобилей, сгруппированных страной происхождения (Origin
), модельный год (Model_Year
) и другие характеристики автомобиля.
Сгруппируйте данные MPG
источником (Origin
) для автомобилей, сделанных в США, Японии и Германии.
Origin = categorical(cellstr(Origin)); MPG_USA = MPG(Origin=='USA'); MPG_Japan = MPG(Origin=='Japan'); MPG_Germany = MPG(Origin=='Germany');
Вычислите и постройте PDF для каждой группы.
[fi,xi] = ksdensity(MPG_USA); plot(xi,fi,'r-') hold on [fj,xj] = ksdensity(MPG_Japan); plot(xj,fj,'b-.') [fk,xk] = ksdensity(MPG_Germany); plot(xk,fk,'k:') legend('USA','Japan','Germany') title('MPG by Origin') xlabel('MPG') hold off
График показывает, как мили на галлон (MPG
) производительность отличаются страной происхождения (Origin
). Используя эти данные, США имеют самое широкое распределение, и его пик в самом низком значении MPG
этих трех источников. Япония имеет самое регулярное распределение с немного более тяжелым левым хвостом, и его пик в самом высоком значении MPG
этих трех источников. Пик для Германии между США и Японией, и второй удар около 44 миль за галлон предполагает, что может быть несколько режимов в данных.
KernelDistribution
| fitdist
| ksdensity