Диаграммы обеспечивают визуализацию итоговой статистики для выборочных данных и содержат следующие функции:
Верха и низ каждого “поля” являются 25-ми и 75-ми процентилями выборок, соответственно. Расстояния между верхами и низом являются межквартильными размахами. Можно вычислить значение межквартильного размаха с помощью iqr
.
Линия посреди каждого поля является демонстрационной медианой. Если медиана не сосредоточена в поле, она показывает демонстрационную скошенность. Можно вычислить значение медианы с помощью median
функция.
Контактные усики являются расширением линий выше и ниже каждого поля. Контактные усики чертятся от концов межквартильных размахов к самым далеким наблюдениям в длине контактного усика (смежные значения).
Наблюдения вне длины контактного усика отмечены как выбросы. По умолчанию выброс является значением, которое является больше чем 1,5 раза межквартильным размахом далеко от верхней части или нижней части поля, но это значение может быть настроено с дополнительными входными параметрами. Выбросы отображены с красным + знак.
Метки отображают изменчивость медианы между выборками. Ширина метки вычисляется так, чтобы диаграммы, метки которых не накладываются (как выше) имели различные медианы на 5%-м уровне значения. Уровень значения основан на предположении нормального распределения, но сравнения медиан довольно устойчивы для других распределений. Сравнение медиан коробчатой диаграммы похоже на визуальный тест гипотезы, аналогичный тесту t, используемому в средних значениях.
Поскольку диаграммы показывают меньше детали, чем гистограммы, они являются самыми полезными для рядом друг с другом сравнений двух распределений.
Загрузите ирисовые выборочные данные Фишера. Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов. Храните лепестковые данные о длине для ирисовых диафрагм versicolor как s1
, и лепестковые данные о длине для virginica диафрагмируют как s2
.
load fisheriris
s1 = meas(51:100,3);
s2 = meas(101:150,3);
Создайте диаграмму с помощью выборочных данных. Включайте метку на графике и пометьте каждое поле именем ирисовых разновидностей, которые это представляет.
figure boxplot([s1 s2],'notch','on',... 'labels',{'versicolor','virginica'})
Метки этих двух диаграмм не накладываются, который указывает, что средняя лепестковая длина versicolor и ирисовых диафрагм virginica существенно отличается на 5%-м уровне значения.
Средняя линия в графике versicolor, кажется, не сосредоточена в поле, которое указывает, что выборка немного скашивается. Кроме того, versicolor данные содержат одно значение выброса, в то время как virginica данные не содержат выбросов.