Grouping variables являются переменными утилиты, используемыми для группирования, или классификации, наблюдений. Сгруппированные переменные полезно для суммирования или визуализации данных по группам. Сгруппированная переменная может быть любым из следующих типов данных:
Числовой вектор
Логический вектор
Символьный массив
Строковые массивы
Массив ячеек из символьных векторов
Категориальный вектор
У сгруппированная переменная должно быть то же количество наблюдений (строк), что и у таблицы, массива набора данных или числового массива, который вы группируете. Наблюдения, которые имеют одно и то же значение сгруппированной переменной, относятся к одной и той же группе.
Для примера следующие переменные состоят из тех же групп. Каждая сгруппированная переменная делит пять наблюдений на две группы. Первая группа содержит первое и четвертое наблюдения. Другие три наблюдения находятся во второй группе.
| Тип данных | Сгруппированная переменная |
|---|---|
| Числовой вектор | [1 2 2 1 2] |
| Логический вектор | [0 1 1 0 1] |
| Строковые массивы | ["Male","Female","Female","Male","Female"] |
| Массив ячеек из символьных векторов | {'Male','Female','Female','Male','Female'} |
| Категориальный вектор | Male Female Female Male Female |
Используйте сгруппированные переменные с метками, чтобы задать каждой группе значимое имя. Категориальный вектор является эффективным и гибким выбором сгруппированной переменной.
Как правило, в сгруппированной переменной существует столько групп, сколько уникальных значений. Однако категориальные векторы могут иметь уровни, которые не представлены в данных. Группы и порядок групп зависят от типа данных сгруппированной переменной. Предположим G является сгруппированной переменной.
Если G является числовым или логическим вектором, тогда группы соответствуют отдельным значениям в G, в отсортированном порядке уникальных значений.
Если G является символьным массивом, строковыми массивами или массивом ячеек векторов символов, тогда группы соответствуют отдельным элементам в G, в порядке их первого внешнего вида.
Если G является категориальным вектором, тогда группы соответствуют уникальным уровням категорий в G, в порядке, возвращенном categories.
Некоторые функции, такие как grpstats, примите несколько сгруппированные переменные, заданных как массив ячеек сгруппированных переменных, например {G1,G2,G3}. В этом случае группы определяются уникальными комбинациями значений в сгруппированных переменных. Порядок определяется сначала порядком первой сгруппированной переменной, затем порядком второй сгруппированной переменной и так далее.
В этой таблице перечислены общие задачи, которые можно выполнить с помощью сгруппированных переменных.
| Группировка задачи | Приемка функций Сгруппированной переменной |
|---|---|
| Нарисуйте параллельные прямоугольные графики для данных в различных группах. | boxplot |
| Нарисуйте график поля точек с маркерами, окрашенными по группам. | gscatter |
| Нарисуйте матрицу графика поля точек с маркерами, окрашенными по группам. | gplotmatrix |
| Вычислите сводную статистику по группам. | grpstats |
| Тест на различия между групповыми средствами. | anovan |
| Создайте вектор индекса из сгруппированной переменной. | grp2idx |
Сгруппированные переменные можете иметь отсутствующие значения при условии, что вы включите действительный индикатор.
| Сгруппированная переменная | Индикатор отсутствующего значения |
|---|---|
| Числовой вектор | NaN |
| Логический вектор | (Не может отсутствовать) |
| Символьный массив | Строка пространств |
| Строковые массивы | <missing> или "" |
| Массив ячеек из символьных векторов | '' |
| Категориальный вектор | <undefined> |