ksdensityВ этом примере показано, как подгонять распределения ядра к сгруппированным данным образца с помощью ksdensity функция.
Загрузите образцы данных.
load carsmallДанные содержат мили на галлон (MPG) измерения для различных марок и моделей автомобилей, сгруппированных по стране происхождения (Origin), модельный год (Model_Year) и другие характеристики транспортного средства.
Группировать MPG данные по происхождению (Origin) для автомобилей, изготовленных в США, Японии и Германии.
Origin = categorical(cellstr(Origin)); MPG_USA = MPG(Origin=='USA'); MPG_Japan = MPG(Origin=='Japan'); MPG_Germany = MPG(Origin=='Germany');
Вычислите и распечатайте pdf для каждой группы.
[fi,xi] = ksdensity(MPG_USA); plot(xi,fi,'r-') hold on [fj,xj] = ksdensity(MPG_Japan); plot(xj,fj,'b-.') [fk,xk] = ksdensity(MPG_Germany); plot(xk,fk,'k:') legend('USA','Japan','Germany') title('MPG by Origin') xlabel('MPG') hold off

На графике показано, как мили на галлон (MPG) различается в зависимости от страны происхождения (Origin). Используя эти данные, США имеют самое широкое распространение, а его пик находится на самом низком MPG значение трех источников. Япония имеет самое регулярное распространение с немного более тяжелым левым хвостом, и его пик находится на самом высоком уровне MPG значение трех источников. Пик для Германии - между США и Японией, и второй удар около 44 миль на галлон говорит о том, что в данных может быть несколько режимов.
fitdist | KernelDistribution | ksdensity