nominal
и ordinal
типы данных массива не рекомендуются. Чтобы представлять упорядоченный и неупорядоченные дискретные, нечисловые данные, используйте Категориальные массивы (MATLAB) тип данных вместо этого.
В этом примере показано, как вычислить итоговую статистику, сгруппированную уровнями категориальной переменной. Можно вычислить статистику сводных данных группы для числового массива или массива набора данных с помощью grpstats
.
Загрузка демонстрационных данных.
load hospital
Массив набора данных, hospital
, имеет 7 переменных (столбцы) и 100 наблюдений (строки).
Вычислите итоговую статистику по категориям.
Переменная Sex
номинальный массив с двумя уровнями, Male
и Female
. Вычислите минимальные и максимальные веса для каждого пола.
stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = Sex GroupCount min_Weight max_Weight Female Female 53 111 147 Male Male 47 158 202
Массив набора данных, stats
, имеет наблюдения, соответствующие уровням переменной Sex
. Переменная min_Weight
содержит минимальный вес для каждой группы и переменную max_Weight
содержит максимальный вес для каждой группы.
Вычислите итоговую статистику несколькими категориями.
Переменная Smoker
логический массив со значением 1
для курильщиков и значения 0
для некурящих. Вычислите минимальные и максимальные веса для каждого пола и курения комбинации.
stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},... 'DataVars','Weight')
stats = Sex Smoker GroupCount min_Weight max_Weight Female_0 Female false 40 111 147 Female_1 Female true 13 115 146 Male_0 Male false 26 158 194 Male_1 Male true 21 164 202
Массив набора данных, stats
, имеет строку наблюдения для каждой комбинации уровней Sex
и Smoker
в исходных данных.