Примечание
nominal и ordinal типы данных массива не рекомендуются. Чтобы представлять упорядоченный и неупорядоченные дискретные, нечисловые данные, используйте тип данных Категориальных массивов вместо этого.
В этом примере показано, как вычислить итоговую статистику, сгруппированную уровнями категориальной переменной. Можно вычислить статистику сводных данных группы для числового массива или массива набора данных с помощью grpstats.
Загрузка демонстрационных данных.
load hospitalМассив набора данных, hospital, имеет 7 переменных (столбцы) и 100 наблюдений (строки).
Вычислите итоговую статистику по категориям.
Переменная Sex номинальный массив с двумя уровнями, Male и Female. Вычислите минимальные и максимальные веса для каждого пола.
stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats =
Sex GroupCount min_Weight max_Weight
Female Female 53 111 147
Male Male 47 158 202
Массив набора данных, stats, имеет наблюдения, соответствующие уровням переменной Sex. Переменная min_Weight содержит минимальный вес для каждой группы и переменную max_Weight содержит максимальный вес для каждой группы.
Вычислите итоговую статистику несколькими категориями.
Переменная Smoker логический массив со значением 1 для курильщиков и значения 0 для некурящих. Вычислите минимальные и максимальные веса для каждого пола и курения комбинации.
stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},...
'DataVars','Weight')stats =
Sex Smoker GroupCount min_Weight max_Weight
Female_0 Female false 40 111 147
Female_1 Female true 13 115 146
Male_0 Male false 26 158 194
Male_1 Male true 21 164 202
Массив набора данных, stats, имеет строку наблюдения для каждой комбинации уровней Sex и Smoker в исходных данных.