Grouping variables являются переменными утилиты, используемыми для группирования, или классификации, наблюдений. Сгруппированные переменные полезно для суммирования или визуализации данных по группам. Сгруппированная переменная может быть любым из следующих типов данных:
Числовой вектор
Логический вектор
Символьный массив
Строковые массивы
Массив ячеек из символьных векторов
Категориальный вектор
У сгруппированная переменная должно быть то же количество наблюдений (строк), что и у таблицы, массива набора данных или числового массива, который вы группируете. Наблюдения, которые имеют одно и то же значение сгруппированной переменной, относятся к одной и той же группе.
Для примера следующие переменные состоят из тех же групп. Каждая сгруппированная переменная делит пять наблюдений на две группы. Первая группа содержит первое и четвертое наблюдения. Другие три наблюдения находятся во второй группе.
Тип данных | Сгруппированная переменная |
---|---|
Числовой вектор | [1 2 2 1 2] |
Логический вектор | [0 1 1 0 1] |
Строковые массивы | ["Male","Female","Female","Male","Female"] |
Массив ячеек из символьных векторов | {'Male','Female','Female','Male','Female'} |
Категориальный вектор | Male Female Female Male Female |
Используйте сгруппированные переменные с метками, чтобы задать каждой группе значимое имя. Категориальный вектор является эффективным и гибким выбором сгруппированной переменной.
Как правило, в сгруппированной переменной существует столько групп, сколько уникальных значений. Однако категориальные векторы могут иметь уровни, которые не представлены в данных. Группы и порядок групп зависят от типа данных сгруппированной переменной. Предположим G
является сгруппированной переменной.
Если G
является числовым или логическим вектором, тогда группы соответствуют отдельным значениям в G
, в отсортированном порядке уникальных значений.
Если G
является символьным массивом, строковыми массивами или массивом ячеек векторов символов, тогда группы соответствуют отдельным элементам в G
, в порядке их первого внешнего вида.
Если G
является категориальным вектором, тогда группы соответствуют уникальным уровням категорий в G
, в порядке, возвращенном categories
.
Некоторые функции, такие как grpstats
, примите несколько сгруппированные переменные, заданных как массив ячеек сгруппированных переменных, например {G1,G2,G3}
. В этом случае группы определяются уникальными комбинациями значений в сгруппированных переменных. Порядок определяется сначала порядком первой сгруппированной переменной, затем порядком второй сгруппированной переменной и так далее.
В этой таблице перечислены общие задачи, которые можно выполнить с помощью сгруппированных переменных.
Группировка задачи | Приемка функций Сгруппированной переменной |
---|---|
Нарисуйте параллельные прямоугольные графики для данных в различных группах. | boxplot |
Нарисуйте график поля точек с маркерами, окрашенными по группам. | gscatter |
Нарисуйте матрицу графика поля точек с маркерами, окрашенными по группам. | gplotmatrix |
Вычислите сводную статистику по группам. | grpstats |
Тест на различия между групповыми средствами. | anovan |
Создайте вектор индекса из сгруппированной переменной. | grp2idx |
Сгруппированные переменные можете иметь отсутствующие значения при условии, что вы включите действительный индикатор.
Сгруппированная переменная | Индикатор отсутствующего значения |
---|---|
Числовой вектор | NaN |
Логический вектор | (Не может отсутствовать) |
Символьный массив | Строка пространств |
Строковые массивы | <missing> или "" |
Массив ячеек из символьных векторов | '' |
Категориальный вектор | <undefined> |