Сгруппированные переменные

Что такое сгруппированные переменные?

Grouping variables являются переменными утилиты, используемыми для группирования, или классификации, наблюдений. Сгруппированные переменные полезно для суммирования или визуализации данных по группам. Сгруппированная переменная может быть любым из следующих типов данных:

  • Числовой вектор

  • Логический вектор

  • Символьный массив

  • Строковые массивы

  • Массив ячеек из символьных векторов

  • Категориальный вектор

У сгруппированная переменная должно быть то же количество наблюдений (строк), что и у таблицы, массива набора данных или числового массива, который вы группируете. Наблюдения, которые имеют одно и то же значение сгруппированной переменной, относятся к одной и той же группе.

Для примера следующие переменные состоят из тех же групп. Каждая сгруппированная переменная делит пять наблюдений на две группы. Первая группа содержит первое и четвертое наблюдения. Другие три наблюдения находятся во второй группе.

Тип данныхСгруппированная переменная
Числовой вектор[1 2 2 1 2]
Логический вектор[0 1 1 0 1]
Строковые массивы["Male","Female","Female","Male","Female"]
Массив ячеек из символьных векторов{'Male','Female','Female','Male','Female'}
Категориальный векторMale Female Female Male Female

Используйте сгруппированные переменные с метками, чтобы задать каждой группе значимое имя. Категориальный вектор является эффективным и гибким выбором сгруппированной переменной.

Определение группы

Как правило, в сгруппированной переменной существует столько групп, сколько уникальных значений. Однако категориальные векторы могут иметь уровни, которые не представлены в данных. Группы и порядок групп зависят от типа данных сгруппированной переменной. Предположим G является сгруппированной переменной.

  • Если G является числовым или логическим вектором, тогда группы соответствуют отдельным значениям в G, в отсортированном порядке уникальных значений.

  • Если G является символьным массивом, строковыми массивами или массивом ячеек векторов символов, тогда группы соответствуют отдельным элементам в G, в порядке их первого внешнего вида.

  • Если G является категориальным вектором, тогда группы соответствуют уникальным уровням категорий в G, в порядке, возвращенном categories.

Некоторые функции, такие как grpstats, примите несколько сгруппированные переменные, заданных как массив ячеек сгруппированных переменных, например {G1,G2,G3}. В этом случае группы определяются уникальными комбинациями значений в сгруппированных переменных. Порядок определяется сначала порядком первой сгруппированной переменной, затем порядком второй сгруппированной переменной и так далее.

Анализ с использованием Сгруппированных переменных

В этой таблице перечислены общие задачи, которые можно выполнить с помощью сгруппированных переменных.

Группировка задачиПриемка функций Сгруппированной переменной
Нарисуйте параллельные прямоугольные графики для данных в различных группах.boxplot
Нарисуйте график поля точек с маркерами, окрашенными по группам.gscatter
Нарисуйте матрицу графика поля точек с маркерами, окрашенными по группам.gplotmatrix
Вычислите сводную статистику по группам.grpstats
Тест на различия между групповыми средствами.anovan
Создайте вектор индекса из сгруппированной переменной.grp2idx

Отсутствующие значения группы

Сгруппированные переменные можете иметь отсутствующие значения при условии, что вы включите действительный индикатор.

Сгруппированная переменнаяИндикатор отсутствующего значения
Числовой векторNaN
Логический вектор(Не может отсутствовать)
Символьный массивСтрока пространств
Строковые массивы<missing> или ""
Массив ячеек из символьных векторов''
Категориальный вектор<undefined>

См. также

Похожие примеры

Подробнее о