exponenta event banner

Группирование переменных

Что такое переменные группировки?

Переменные группирования - это переменные утилиты, используемые для группирования или категоризации наблюдений. Группирование переменных полезно для суммирования или визуализации данных по группам. Переменной группирования может быть любой из следующих типов данных:

  • Числовой вектор

  • Логический вектор

  • Символьный массив

  • Строковый массив

  • Массив ячеек символьных векторов

  • Категориальный вектор

Переменная группирования должна иметь то же количество наблюдений (строк), что и группируемая таблица, массив наборов данных или числовой массив. Наблюдения, имеющие одно и то же значение переменной группировки, относятся к одной и той же группе.

Например, следующие переменные содержат одни и те же группы. Каждая переменная группирования делит пять наблюдений на две группы. Первая группа содержит первое и четвертое наблюдения. Остальные три наблюдения относятся ко второй группе.

Тип данныхГруппировка переменных
Числовой вектор[1 2 2 1 2]
Логический вектор[0 1 1 0 1]
Строковый массив["Male","Female","Female","Male","Female"]
Массив ячеек символьных векторов{'Male','Female','Female','Male','Female'}
Категориальный векторMale Female Female Male Female

Используйте группирование переменных с метками, чтобы дать каждой группе значимое имя. Категориальный вектор - это эффективный и гибкий выбор переменной группировки.

Определение группы

Обычно в переменной группировки существует столько же групп, сколько уникальных значений. Однако категориальные векторы могут иметь уровни, которые не представлены в данных. Группы и порядок групп зависят от типа данных переменной группировки. Предположим G является переменной группировки.

  • Если G является числовым или логическим вектором, то группы соответствуют различным значениям в G, в отсортированном порядке уникальных значений.

  • Если G является символьным массивом, строковым массивом или массивом ячеек символьных векторов, то группы соответствуют различным элементам в G, в порядке их первого появления.

  • Если G является категориальным вектором, то группы соответствуют уникальным уровням категорий в G, в порядке, возвращенном categories.

Некоторые функции, такие как grpstats, принять несколько переменных группирования, указанных как массив ячеек переменных группирования, например, {G1,G2,G3}. В этом случае группы определяются уникальными комбинациями значений в переменных группировки. Порядок определяется сначала порядком первой переменной группирования, затем порядком второй переменной группирования и так далее.

Анализ с использованием переменных группировки

В этой таблице перечислены общие задачи, которые можно выполнить с помощью переменных группировки.

Задача группировкиФункция, принимающая переменную группировки
Нарисуйте параллельные графики для данных в различных группах.boxplot
Нарисуйте график рассеяния с маркерами, окрашенными по группам.gscatter
Нарисуйте матрицу графика рассеяния с маркерами, окрашенными по группам.gplotmatrix
Вычислить сводную статистику по группам.grpstats
Тест на различия между групповыми средами.anovan
Создайте вектор индекса из переменной группировки.grp2idx

Отсутствующие значения группы

Переменные группировки могут иметь отсутствующие значения при условии наличия допустимого индикатора.

Тип данных переменной группировкиИндикатор отсутствующего значения
Числовой векторNaN
Логический вектор(Не может отсутствовать)
Символьный массивСтрока пробелов
Строковый массив<missing> или ""
Массив ячеек символьных векторов''
Категориальный вектор<undefined>

См. также

Связанные примеры

Подробнее