Примечание
The nominal
и ordinal
типы данных массива не рекомендованы. Чтобы представлять упорядоченные и неупорядоченные дискретные нечисловые данные, используйте вместо этого тип данных Категориальные Массивы.
В этом примере показано, как вычислить итоговую статистику, сгруппированную по уровням категориальной переменной. Можно вычислить сводную статистику групп для числового массива или массива набора данных с помощью grpstats
.
Загрузите выборочные данные.
load hospital
Массив набора данных, hospital
, имеет 7 переменных (столбцов) и 100 наблюдений (строк).
Вычислите итоговую статистику по категориям.
Переменная Sex
- номинальный массив с двумя уровнями, Male
и Female
. Вычислите минимальный и максимальный веса для каждого пола.
stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = Sex GroupCount min_Weight max_Weight Female Female 53 111 147 Male Male 47 158 202
Массив набора данных, stats
, имеет наблюдения, соответствующие уровням переменной Sex
. Переменная min_Weight
содержит минимальный вес для каждой группы и переменную max_Weight
содержит максимальный вес для каждой группы.
Вычислите сводную статистику по нескольким категориям.
Переменная Smoker
- логический массив со значением 1
для курильщиков и ценностных 0
для некурящих. Вычислите минимальный и максимальный веса для каждого пола и комбинации курения.
stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},... 'DataVars','Weight')
stats = Sex Smoker GroupCount min_Weight max_Weight Female_0 Female false 40 111 147 Female_1 Female true 13 115 146 Male_0 Male false 26 158 194 Male_1 Male true 21 164 202
Массив набора данных, stats
, имеет строку наблюдения для каждой комбинации уровней Sex
и Smoker
в исходных данных.