Подгонка распределений по сгруппированным данным с помощью `ksdensity`

Открыть сценарий в реальном времени

В этом примере показано, как подгонять распределения ядра к сгруппированным данным образца с помощью ksdensity функция.

Шаг 1. Загрузить данные образца.

Загрузите образцы данных.

load carsmall

Данные содержат мили на галлон (MPG) измерения для различных марок и моделей автомобилей, сгруппированных по стране происхождения (Origin), модельный год (Model_Year) и другие характеристики транспортного средства.

Шаг 2. Группировать данные выборки по происхождению.

Группировать MPG данные по происхождению (Origin) для автомобилей, изготовленных в США, Японии и Германии.

Origin = categorical(cellstr(Origin));
MPG_USA = MPG(Origin=='USA');
MPG_Japan = MPG(Origin=='Japan');
MPG_Germany = MPG(Origin=='Germany');

Шаг 3. Вычислите и распечатайте pdf.

Вычислите и распечатайте pdf для каждой группы.

[fi,xi] = ksdensity(MPG_USA);
plot(xi,fi,'r-')
hold on

[fj,xj] = ksdensity(MPG_Japan);
plot(xj,fj,'b-.')

[fk,xk] = ksdensity(MPG_Germany);
plot(xk,fk,'k:')

legend('USA','Japan','Germany')
title('MPG by Origin')
xlabel('MPG')
hold off

Figure contains an axes. The axes with title MPG by Origin contains 3 objects of type line. These objects represent USA, Japan, Germany.

На графике показано, как мили на галлон (MPG) различается в зависимости от страны происхождения (Origin). Используя эти данные, США имеют самое широкое распространение, а его пик находится на самом низком MPG значение трех источников. Япония имеет самое регулярное распространение с немного более тяжелым левым хвостом, и его пик находится на самом высоком уровне MPG значение трех источников. Пик для Германии - между США и Японией, и второй удар около 44 миль на галлон говорит о том, что в данных может быть несколько режимов.

См. также

fitdist | KernelDistribution | ksdensity

Связанные темы

Документация по инструментам для статистического и машинного обучения

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация

Подгонка распределений по сгруппированным данным с помощью ksdensity