Переменные группирования - это переменные утилиты, используемые для группирования или категоризации наблюдений. Группирование переменных полезно для суммирования или визуализации данных по группам. Переменной группирования может быть любой из следующих типов данных:
Числовой вектор
Логический вектор
Символьный массив
Строковый массив
Массив ячеек символьных векторов
Категориальный вектор
Переменная группирования должна иметь то же количество наблюдений (строк), что и группируемая таблица, массив наборов данных или числовой массив. Наблюдения, имеющие одно и то же значение переменной группировки, относятся к одной и той же группе.
Например, следующие переменные содержат одни и те же группы. Каждая переменная группирования делит пять наблюдений на две группы. Первая группа содержит первое и четвертое наблюдения. Остальные три наблюдения относятся ко второй группе.
| Тип данных | Группировка переменных |
|---|---|
| Числовой вектор | [1 2 2 1 2] |
| Логический вектор | [0 1 1 0 1] |
| Строковый массив | ["Male","Female","Female","Male","Female"] |
| Массив ячеек символьных векторов | {'Male','Female','Female','Male','Female'} |
| Категориальный вектор | Male Female Female Male Female |
Используйте группирование переменных с метками, чтобы дать каждой группе значимое имя. Категориальный вектор - это эффективный и гибкий выбор переменной группировки.
Обычно в переменной группировки существует столько же групп, сколько уникальных значений. Однако категориальные векторы могут иметь уровни, которые не представлены в данных. Группы и порядок групп зависят от типа данных переменной группировки. Предположим G является переменной группировки.
Если G является числовым или логическим вектором, то группы соответствуют различным значениям в G, в отсортированном порядке уникальных значений.
Если G является символьным массивом, строковым массивом или массивом ячеек символьных векторов, то группы соответствуют различным элементам в G, в порядке их первого появления.
Если G является категориальным вектором, то группы соответствуют уникальным уровням категорий в G, в порядке, возвращенном categories.
Некоторые функции, такие как grpstats, принять несколько переменных группирования, указанных как массив ячеек переменных группирования, например, {G1,G2,G3}. В этом случае группы определяются уникальными комбинациями значений в переменных группировки. Порядок определяется сначала порядком первой переменной группирования, затем порядком второй переменной группирования и так далее.
В этой таблице перечислены общие задачи, которые можно выполнить с помощью переменных группировки.
| Задача группировки | Функция, принимающая переменную группировки |
|---|---|
| Нарисуйте параллельные графики для данных в различных группах. | boxplot |
| Нарисуйте график рассеяния с маркерами, окрашенными по группам. | gscatter |
| Нарисуйте матрицу графика рассеяния с маркерами, окрашенными по группам. | gplotmatrix |
| Вычислить сводную статистику по группам. | grpstats |
| Тест на различия между групповыми средами. | anovan |
| Создайте вектор индекса из переменной группировки. | grp2idx |
Переменные группировки могут иметь отсутствующие значения при условии наличия допустимого индикатора.
| Тип данных переменной группировки | Индикатор отсутствующего значения |
|---|---|
| Числовой вектор | NaN |
| Логический вектор | (Не может отсутствовать) |
| Символьный массив | Строка пробелов |
| Строковый массив | <missing> или "" |
| Массив ячеек символьных векторов | '' |
| Категориальный вектор | <undefined> |