boxplot

Описание

пример

boxplot(x) создает диаграмму данных в x. Если x вектор, boxplot графики одно поле. Если x матрица, boxplot графики одно поле для каждого столбца x.

На каждом поле центральная метка указывает на медиану, и нижняя часть и верхние края поля указывают на 25-е и 75-е процентили, соответственно. Контактные усики расширяют к самым экстремальным точкам данных, не рассмотренным выбросами, и выбросы построены индивидуально с помощью '+' символ.

пример

boxplot(x,g) создает диаграмму с помощью одной или нескольких сгруппированных переменных, содержавшихся в g. boxplot производит отдельное поле для каждого набора x значения, которые совместно используют тот же g значение или значения.

boxplot(ax,___) создает диаграмму с помощью осей, заданных графическим объектом осей ax, использование любого из предыдущих синтаксисов.

пример

boxplot(___,Name,Value) создает диаграмму с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы. Например, можно задать стиль поля или порядок.

Примеры

свернуть все

Загрузите выборочные данные.

load carsmall

Создайте диаграмму миль на галлон (MPG) измерения. Добавьте заголовок и подпишите оси.

boxplot(MPG)
xlabel('All Vehicles')
ylabel('Miles per Gallon (MPG)')
title('Miles per Gallon for All Vehicles')

Коробчатая диаграмма показывает, что средние мили на галлон для всех транспортных средств в выборочных данных - приблизительно 24. Минимальное значение - приблизительно 9, и максимальное значение - приблизительно 44.

Загрузите выборочные данные.

load carsmall

Создайте диаграмму миль на галлон (MPG) измерения от выборочных данных, сгруппированных страной происхождения транспортных средств (Origin). Добавьте заголовок и подпишите оси.

boxplot(MPG,Origin)
title('Miles per Gallon by Vehicle Origin')
xlabel('Country of Origin')
ylabel('Miles per Gallon (MPG)')

Каждое поле визуально представляет данные о MPG для автомобилей из заданной страны. "Поле" Италии появляется как одна строка, потому что выборочные данные содержат только одно наблюдение для этой группы.

Сгенерируйте два набора выборочных данных. Первая выборка, x1, содержит случайные числа, сгенерированные от нормального распределения с mu = 5 и sigma = 1. Вторая выборка, x2, содержит случайные числа, сгенерированные от нормального распределения с mu = 6 и sigma = 1.

rng default  % For reproducibility
x1 = normrnd(5,1,100,1);
x2 = normrnd(6,1,100,1);

Создайте отмеченные диаграммы x1 и x2. Пометьте каждое поле его соответствующим mu значение.

figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'})
title('Compare Random Data from Different Distributions')

Коробчатая диаграмма показывает, что различие между медианами этих двух групп - приблизительно 1. Поскольку метки в диаграмме не накладываются, можно прийти к заключению с 95%-й уверенностью, что истинные медианы действительно отличаются.

Следующий рисунок показывает диаграмму для тех же данных с максимальной длиной контактного усика, заданной как 1.0 раза межквартильный размах. Точки данных вне контактных усиков отображены с помощью +.

figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'},'Whisker',1)
title('Compare Random Data from Different Distributions')

С контактными усиками меньшего размера, boxplot отображения больше точек данных как выбросы.

Создайте 100 25 матрица случайных чисел, сгенерированных от стандартного нормального распределения, чтобы использовать в качестве выборочных данных.

rng default  % For reproducibility
x = randn(100,25);

Создайте две диаграммы для данных в x на той же фигуре. Используйте форматирование значения по умолчанию в главном графике и компактное форматирование для нижнего графика.

figure

subplot(2,1,1)
boxplot(x)

subplot(2,1,2)
boxplot(x,'PlotStyle','compact')

Каждый график представляет те же данные, но компактное форматирование может улучшить удобочитаемость для графиков со многими полями.

Создайте диаграммы для векторов данных различной длины при помощи сгруппированной переменной.

Случайным образом сгенерируйте три вектор-столбца различной длины: одна из длины 5, одна из длины 10, и одна из длины 15. Объедините данные в вектор отдельного столбца длины 30.

rng('default')  % For reproducibility
x1 = rand(5,1);
x2 = rand(10,1);
x3 = rand(15,1);
x = [x1; x2; x3];

Создайте сгруппированную переменную, которая присваивает то же значение строкам, которые соответствуют тому же вектору в x. Например, первые пять строк g имейте то же значение, First, потому что первые пять строк x все прибывают из того же вектора, x1.

g1 = repmat({'First'},5,1);
g2 = repmat({'Second'},10,1);
g3 = repmat({'Third'},15,1);
g = [g1; g2; g3];

Создайте диаграммы.

boxplot(x,g)

Входные параметры

свернуть все

Входные данные, заданные как числовая векторная или числовая матрица. Если x вектор, boxplot графики одно поле. Если x матрица, boxplot графики одно поле для каждого столбца x.

На каждом поле центральная метка указывает на медиану, и нижняя часть и верхние края поля указывают на 25-е и 75-е процентили, соответственно. Контактные усики расширяют к самым экстремальным точкам данных, не рассмотренным выбросами, и выбросы построены индивидуально с помощью '+' символ.

Типы данных: single | double

Сгруппированные переменные, заданные как числовой вектор, символьный массив, массив строк, массив ячеек или категориальный массив. Можно задать несколько сгруппированных переменных в g при помощи массива ячеек этих тип переменных или матрицы. Если вы задаете несколько сгруппированных переменных, они должны все быть той же длиной.

Если x вектор, затем сгруппированные переменные должны содержать одну строку для каждого элемента x. Если x матрица, затем сгруппированные переменные должны содержать одну строку для каждого столбца x. Группы, которые содержат отсутствующее значение (NaN), пустой символьный вектор, пустое или <missing> представьте в виде строки, или <undefined> значение в сгруппированной переменной не использовано и не считается в количестве групп, рассмотренных другими параметрами.

По умолчанию, boxplot символ видов и сгруппированные переменные строки в порядке они первоначально появляются в данных, категориальных сгруппированных переменных по приказу их уровней и числовых сгруппированных переменных в числовом порядке. Чтобы управлять порядком групп, выполнить одно из следующих действий:

  • Используйте категориальные переменные в g и задайте порядок их уровней.

  • Используйте 'GroupOrder' аргумент пары "имя-значение".

  • Предварительно отсортируйте свои данные.

Типы данных: single | double | char | string | cell | categorical

Оси, на которых можно построить, заданный как графический объект осей. Если вы не задаете ax, затем boxplot создает график с помощью текущей оси. Для получения дополнительной информации о создании графического объекта осей смотрите axes и Свойства осей графика.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Notch','on','Labels',{'mu = 5','mu = 6'} создает с пазами диаграмму и помечает эти два поля mu = 5 и mu = 6, слева направо

Внешний вид поля

свернуть все

Стиль поля, заданный как разделенная запятой пара, состоящая из 'BoxStyle' и одно из следующих.

ИмяЗначение
'outline'Постройте поля с помощью незаполненного поля с пунктирными контактными усиками. Это - значение по умолчанию если 'PlotStyle' 'traditional'.
'filled'Постройте поля с помощью узкого заполненного поля с линиями для контактных усиков. Это - значение по умолчанию если 'PlotStyle' 'compact'.

Пример: 'BoxStyle','filled'

Цвета поля, заданные как разделенная запятой пара, состоящая из 'Colors' и триплет RGB, вектор символов или скаляр строки. Триплет RGB является трехэлементным вектором-строкой, элементы которого задают интенсивность красных, зеленых, и синих компонентов цвета, соответственно. Каждая интенсивность должна быть в области значений [0,1].

В следующей таблице перечислены доступные цветные символы и их эквивалентные значения триплета RGB.

Длинное имяКраткое названиеТриплет RGB
Желтый'y'[1 1 0]
Пурпурный'm'[1 0 1]
Голубой'c'[0 1 1]
Красный'r'[1 0 0]
Зеленый'g'[0 1 0]
Синий'b'[0 0 1]
Белый'w'[1 1 1]
Черный'k'[0 0 0]

Можно задать несколько цветов или как вектор символов или представить скаляр в виде строки названий цвета (например, 'rgbm') или матрица с тремя столбцами значений RGB. Последовательность реплицирована или усеченная как требуется, так например, 'rb' дает поля, которые чередуются красный и синий.

Если вы не задаете пару "имя-значение" 'ColorGroup', затем boxplot использует ту же цветовую схему во всех полях. Если вы действительно задаете 'ColorGroup', затем значением по умолчанию является модифицированный hsv colormap.

Пример: 'Colors','rgbm'

Средний стиль, заданный как разделенная запятой пара, состоящая из 'MedianStyle' и одно из следующих.

ИмяЗначение
'line'Чертите линию, чтобы представлять медиану в каждом поле. Это - значение по умолчанию когда 'PlotStyle' 'traditional'.
'target'Чертите черную точку в белом кругу, чтобы представлять медиану в каждом поле. Это - значение по умолчанию когда 'PlotStyle' 'compact'.

Пример: 'MedianStyle','target'

Маркер для интервалов сравнения, заданных как разделенная запятой пара, состоящая из 'Notch' и одно из следующих.

ИмяЗначение
'off'Не используйте интервалы сравнения от вывода информации на экран.
'on'Если 'PlotStyle' 'traditional', чертите интервалы сравнения с помощью меток. Если 'PlotStyle' 'compact', чертите интервалы сравнения с помощью треугольных маркеров.
'marker'Чертите интервалы сравнения с помощью треугольных маркеров.

Две медианы существенно отличаются на 5%-м уровне значения, если их интервалы не накладываются. boxplot представляет конечные точки интервала с помощью экстремальных значений меток или центров треугольных маркеров. Экстремальные значения метки соответствуют q 2 – 1.57 (q 3q 1)/sqrt (n) и q 2 + 1.57 (q 3q 1)/sqrt (n), где q 2 является медианой (50-я процентиль), q 1 и q 3 является 25-ми и 75-ми процентилями, соответственно, и n является количеством наблюдений без любого NaN значения. Если объем выборки мал, метки могут расширить вне конца поля.

Пример: 'Notch','on'

Размер маркера для выбросов, заданных как разделенная запятой пара, состоящая из 'OutlierSize' и положительное числовое значение. Заданное значение представляет размер маркера в точках.

Если 'PlotStyle' 'traditional', затем значение по умолчанию для OutlierSize 6. Если 'PlotStyle' 'compact', затем значение по умолчанию для OutlierSize 4.

Пример: 'OutlierSize',8

Типы данных: single | double

Стиль графика, заданный как разделенная запятой пара, состоящая из 'PlotStyle' и одно из следующих.

ИмяЗначение
'traditional'Постройте поля с помощью традиционного стиля поля.
'compact'Постройте поля с помощью меньшего стиля поля, спроектированного для графиков со многими группами. Это изменения стиля значения по умолчанию для некоторых других параметров.

Пример: 'PlotStyle','compact'

Символ и цвет для выбросов, заданных как разделенная запятой пара, состоящая из 'Symbol' и спецификация линии. Смотрите LineSpec параметр в plot для доступных спецификаций линии.

Если 'PlotStyle' 'traditional', затем значением по умолчанию является 'r+', который строит каждый выброс с помощью красного '+' символ.

Если 'PlotStyle' 'compact', затем значением по умолчанию является 'o', который строит каждый выброс с помощью 'o' символ в том же цвете как соответствующее поле.

Если вы не используете символ, то выбросы кажутся невидимыми. Если вы не используете цвет, то выбросы появляются в том же цвете как поле.

Пример: 'kx'

Поле width, заданное как разделенная запятой пара, состоящая из 'Widths' и числовой скаляр или числовой вектор. Если количество полей не равно количеству заданных значений ширины, то список значений реплицирован или усеченный по мере необходимости.

Этот аргумент пары "имя-значение" не изменяет интервал между полями. Поэтому, если вы задаете большое значение для 'Widths', поля могут наложиться.

Поле width по умолчанию равно половине минимального разделения между полями, которое является 0.5 когда 'Positions' аргумент пары "имя-значение" берет свое значение по умолчанию.

Пример: 'Widths',0.3

Типы данных: single | double

Внешний вид группы

свернуть все

Сгруппированная переменная для изменения цвета поля, заданного как разделенная запятой пара, состоящая из 'ColorGroup' и сгруппированная переменная. Сгруппированная переменная является числовым вектором, символьным массивом, массивом строк, массивом ячеек или категориальным массивом. Цвет поля изменяется, когда заданная сгруппированная переменная изменяется. Значение по умолчанию [] указывает, что цвет поля не изменяется на основе группы.

Типы данных: single | double | char | string | cell | categorical

Порядок факторов на графике, заданном как разделенная запятой пара, состоящая из 'FactorDirection' и одно из следующих.

ИмяЗначение
'data'Факторы появляются с первым значением рядом с источником графика.
'list'Факторы появляются слева направо если на оси X, или от начала до конца если на оси Y.
'auto'Если сгруппированные переменные являются числовыми, то boxplot использование 'data'. Если сгруппированные переменные являются символьными массивами, строковыми массивами, массивами ячеек или категориальными массивами, то boxplot использование 'list'.

Постройте все факторы группы, заданные как разделенная запятой пара, состоящая из 'FullFactors' и любой 'off' или 'on'. Если 'off', затем boxplot графики одно поле для каждой уникальной строки сгруппированных переменных. Если 'on', затем boxplot графики одно поле для каждой возможной комбинации значений сгруппированной переменной, включая комбинации, которые не появляются в данных.

Пример: 'FullFactors','on'

Расстояние между различными факторами группировки, заданными как разделенная запятой пара, состоящая из 'FactorGap' и положительное числовое значение, вектор положительных числовых значений или 'auto'. Если вы задаете вектор, то длина вектора должна быть меньше чем или равна количеству сгруппированных переменных.

'FactorGap' представляет расстояние разрыва между различными факторами сгруппированной переменной, выраженной как процент ширины графика. Например, если вы задаете [3,1], затем разрыв составляет три процента ширины графика между группами с различными значениями первой сгруппированной переменной и один процент между группами с тем же значением первой сгруппированной переменной, но различными значениями для второго.

Если вы задаете 'auto', затем boxplot выбирает расстояние разрыва автоматически. Значение [] не указывает ни на какое изменение в размере разрыва между различными факторами.

Если 'PlotStyle' 'traditional', затем значение по умолчанию для FactorGap []. Если 'PlotStyle' 'compact', затем значением по умолчанию является 'auto'.

Пример: 'FactorGap',[3,1]

Типы данных: single | double | char | string

Разделение между группирующимися факторами, заданными как разделенная запятой пара, состоящая из 'FactorSeparator' и положительное целое число или вектор положительных целых чисел или 'auto'. Если вы задаете вектор, то длина вектора должна быть меньше чем или равна количеству сгруппированных переменных. Целочисленные значения должны быть в области значений [1, G], где G является количеством сгруппированных переменных.

'FactorSeparator' задает, каким факторам должна разделить их значения линия сетки. Например, [1,2] добавляет линию диафрагмы, когда первая или вторая сгруппированная переменная изменяет значение.

Если 'PlotStyle' 'traditional', затем значение по умолчанию для FactorSeparator []. Если 'PlotStyle' 'compact', затем значением по умолчанию является 'auto'.

Пример: 'FactorSeparator',[1,2]

Типы данных: single | double | char | string

Графический вывод порядка групп, заданных как разделенная запятой пара, состоящая из 'GroupOrder' и массив строк или массив ячеек, содержащий имена сгруппированных переменных. Если вы имеете несколько сгруппированных переменных, разделяете значения запятой. Можно также использовать категориальные массивы в качестве сгруппированных переменных, чтобы управлять порядком полей. Значение по умолчанию [] не переупорядочивает поля.

Типы данных: string | cell

Пределы данных и максимальные расстояния

свернуть все

Экстремальные пределы данных, заданные как разделенная запятой пара, состоящая из 'DataLim' и двухэлементный числовой вектор, содержащий нижние и верхние пределы, соответственно. Значения заданы для 'DataLim' используются 'ExtremeMode' определить, какие точки данных являются экстремальным значением.

Типы данных: single | double

Метод обработки для экстремальных данных, заданных как разделенная запятой пара, состоящая из 'ExtremeMode' и одно из следующих.

ИмяЗначение
'clip'Если какие-либо значения данных выходят за пределы пределов, заданных 'DataLim', затем boxplot отображения эти значения в DataLim на графике.
'compress'Если какие-либо значения данных выходят за пределы пределов, заданных 'DataLim' , затем boxplot отображения эти значения, равномерно распределенные в области только вне DataLim, сохранение относительного порядка точек.

Если какие-либо точки данных лежат вне предела, заданного 'DataLim', затем предел отмечен пунктирной линией. Если какие-либо точки данных сжаты, то две серых линии отмечают область сжатия. Значения в –Inf или Inf может быть отсечен или сжат, но NaN значения не появляются на графике. Метки поля чертятся в масштабе и могут расширить вне границ, если медиана в пределе. Метки поля не чертятся, если медиана вне пределов.

Пример: 'ExtremeMode','compress'

Максимальное расстояние смещения выброса, заданное как разделенная запятой пара, состоящая из 'Jitter' и числовое значение. Jitter максимальное расстояние должно переместить выбросы вдоль факторной оси универсальной случайной суммой, для того, чтобы сделать дублирующиеся точки видимыми. Если вы задаете 'Jitter' равняйтесь 1, затем области дрожания только затрагивают между самыми близкими смежными группами.

Если 'PlotStyle' 'traditional', затем значение по умолчанию для Jitter 0. Если 'PlotStyle' 'compact', затем значение по умолчанию 0.5.

Пример: 'Jitter',1

Типы данных: single | double

Максимальная длина контактного усика, заданная как разделенная запятой пара, состоящая из 'Whisker' и положительное числовое значение.

boxplot чертит точки как выбросы, если они больше q 3 + w × (q 3q 1) или меньше, чем q 1w × (q 3q 1), где w является максимальной длиной контактного усика, и q 1 и q 3 является 25-ми и 75-ми процентилями выборочных данных, соответственно.

Значение по умолчанию для 'Whisker' соответствует приблизительно +/–2.7σ и покрытие на 99,3 процентов, если данные нормально распределены. Нанесенный на график контактный усик расширяет к смежному значению, которое является самым экстремальным значением данных, которое не является выбросом.

Задайте 'Whisker' как 0, чтобы не дать контактные усики и высказать каждое мнение за пределами q 1 и q 3 выброс.

Пример: 'Whisker',0

Типы данных: single | double

Постройте внешний вид

свернуть все

Метки поля, заданные как разделенная запятой пара, состоящая из 'Labels' и символьный массив, массив строк, массив ячеек или числовой вектор, содержащий поле, помечают имена. Задайте одну метку на x значение или одна метка на группу. Чтобы задать несколько переменных метки, используйте числовую матрицу или массив ячеек, содержащий любой из принятых типов данных.

Чтобы удалить метки из графика, используйте следующую команду: set(gca,'XTickLabel',{' '}).

Типы данных: char | string | cell | single | double

Пометьте ориентацию, заданную как разделенная запятой пара, состоящая из 'LabelOrientation' и одно из следующих.

ИмяЗначение
'inline'Вращайте метки поля, чтобы быть вертикальными. Это - значение по умолчанию когда 'PlotStyle' 'compact'.
'horizontal'Уезжайте поле помечает горизонталь. Это - значение по умолчанию когда 'PlotStyle' 'traditional'.

Если метки находятся на оси y, то обе настройки оставляют горизонталь меток.

Пример: 'LabelOrientation','inline'

Метки, чтобы отобразиться на графике, заданном как разделенная запятой пара, состоящая из LabelVerbosity и одно из следующих.

ИмяЗначение
'all'Отобразите метку для каждого фактора. Это - значение по умолчанию когда 'PlotStyle' 'traditional'.
'minor'Отобразите метку для фактора только, когда тот фактор будет иметь различное значение от предыдущей группы.
'majorminor'Отобразите метку для фактора, когда у того фактора или любого факторного майора к нему будет различное значение от предыдущей группы. Это - значение по умолчанию когда 'PlotStyle' 'compact'.

Пример: 'LabelVerbosity','minor'

Постройте ориентацию, заданную как разделенная запятой пара, состоящая из Ориентации и одно из следующих.

ИмяЗначение
'vertical'Постройте x на y - ось.
'horizontal'Постройте x на x - ось.

Пример: 'horizontal'

Положения поля, заданные как разделенная запятой пара, состоящая из 'Positions' и числовой вектор, содержащий одну запись для каждой группы или x значение. Значение по умолчанию 1:NumGroups, где NumGroups является количеством групп.

Типы данных: single | double

Советы

  • boxplot создает визуальное представление данных, но не возвращает числовые значения. Чтобы вычислить соответствующую итоговую статистику для выборочных данных, используйте следующие функции:

    • min — Найдите минимальное значение в выборочных данных.

    • max — Найдите максимальное значение в выборочных данных.

    • median — Найдите среднее значение в выборочных данных.

    • quantile — Найдите значения квантиля в выборочных данных.

    • grpstats — Вычислите итоговую статистику для выборочных данных, организованных группой.

  • Вы видите значения данных и названия группы с помощью Data Cursor (MATLAB) в окне рисунка. Курсор показывает исходные значения любых точек, затронутых datalim параметр. Можно пометить группу, которой выброс принадлежит с помощью gname функция.

  • Чтобы изменить графические свойства компонента диаграммы, используйте findobj с Tag свойство найти указатель компонента. Tag значения для компонентов диаграммы зависят от установок параметров и перечислены в следующей таблице.

    Установки параметровПометьте значения
    Все настройки
    • 'Box'

    • 'Outliers'

    Когда 'PlotStyle' 'traditional'
    • 'Median'

    • 'Upper Whisker'

    • 'Lower Whisker'

    • 'Upper Adjacent Value'

    • 'Lower Adjacent Value'

    Когда 'PlotStyle' 'compact'
    • 'Whisker'

    • 'MedianOuter'

    • 'MedianInner'

    Когда 'Notch' 'marker'
    • 'NotchLo'

    • 'NotchHi'

Ссылки

[1] Макгилл, R., Дж. В. Туки и В. А. Ларсен. “Изменения Коробчатых диаграмм”. Американский Статистик. Издание 32, № 1, 1978, стр 12–16.

[2] Веллемен, P.F., и Hoaglin округа Колумбия. Приложения, основы и вычисление исследовательского анализа данных. Пасифик-Гроув, CA: нажатие Даксбери, 1981.

[3] Нельсон, L. S. “Оценивая Перекрывающиеся Доверительные интервалы”. Журнал Качественной Технологии. Издание 21, 1989, стр 140–141.

[4] Лэнгфорд, E. “Квартили в элементарной статистике”, журнал образования статистики. Издание 14, № 3, 2006.

Представлено до R2006a