Диаграммы

Диаграммы обеспечивают визуализацию итоговой статистики для выборочных данных и содержат следующие функции:

  • Верха и низ каждого “поля” являются 25-ми и 75-ми процентилями выборок, соответственно. Расстояния между верхами и низом являются межквартильными размахами. Можно вычислить значение межквартильного размаха с помощью iqr.

  • Строка посреди каждого поля является демонстрационной медианой. Если медиана не сосредоточена в поле, она показывает демонстрационную скошенность. Можно вычислить значение медианы с помощью функции median.

  • Контактные усики являются расширением строк выше и ниже каждого поля. Контактные усики чертятся от концов межквартильных размахов к самым далеким наблюдениям в длине контактного усика (смежные значения).

  • Наблюдения вне длины контактного усика отмечены как выбросы. По умолчанию выброс является значением, которое является больше чем 1,5 раза межквартильным размахом далеко от верхней части или нижней части поля, но это значение может быть настроено с дополнительными входными параметрами. Выбросы отображены с красным + знак.

  • Метки отображают изменчивость медианы между выборками. Ширина метки вычисляется так, чтобы диаграммы, метки которых не накладываются (как выше) имели различные медианы на 5%-м уровне значения. Уровень значения основан на предположении нормального распределения, но сравнения медиан довольно устойчивы для других дистрибутивов. Сравнение медиан коробчатой диаграммы похоже на визуальный тест гипотезы, аналогичный тесту t, используемому для средних значений.

Поскольку диаграммы показывают меньше детали, чем гистограммы, они являются самыми полезными для бок о бок сравнений двух дистрибутивов.

Сравните сгруппированные данные Используя диаграммы

Загрузите ирисовые выборочные данные Фишера. Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов. Храните лепестковые данные о длине для ирисовых диафрагм versicolor как s1 и лепестковые данные о длине для ирисовых диафрагм virginica как s2.

load fisheriris
s1 = meas(51:100,3);
s2 = meas(101:150,3);

Создайте диаграмму с помощью выборочных данных. Включайте метку на графике и маркируйте каждое поле именем ирисовых разновидностей, которые это представляет.

figure
boxplot([s1 s2],'notch','on',...
        'labels',{'versicolor','virginica'})

Метки этих двух диаграмм не накладываются, который указывает, что средняя лепестковая длина versicolor и ирисовых диафрагм virginica существенно отличается на 5%-м уровне значения.

Средняя строка в графике versicolor, кажется, не сосредоточена в поле, которое указывает, что выборка немного скашивается. Кроме того, versicolor данные содержат одно значение выброса, в то время как virginica данные не содержат выбросов.

Смотрите также

| |

Похожие темы