nominal
и типы данных массива ordinal
могут быть удалены в будущем релизе. Чтобы представлять упорядоченный и неупорядоченные дискретные, нечисловые данные, используйте Категориальные массивы (MATLAB) тип данных вместо этого.
Этот пример показывает, как вычислить итоговую статистику, сгруппированную уровнями категориальной переменной. Можно вычислить статистику сводных данных группы для числового массива или массива набора данных с помощью grpstats
.
Загрузка демонстрационных данных.
load hospital
Массив набора данных, hospital
, имеет 7 переменных (столбцы) и 100 наблюдений (строки).
Вычислите итоговую статистику по категориям.
Переменная Sex
является номинальным массивом с двумя уровнями, Male
и Female
. Вычислите минимальные и максимальные веса для каждого пола.
stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = Sex GroupCount min_Weight max_Weight Female Female 53 111 147 Male Male 47 158 202
Массив набора данных, stats
, имеет наблюдения, соответствующие уровням переменной Sex
. Переменная min_Weight
содержит минимальный вес для каждой группы, и переменная max_Weight
содержит максимальный вес для каждой группы.
Вычислите итоговую статистику несколькими категориями.
Переменная Smoker
является логическим массивом со значением 1
для курильщиков и значения 0
для некурящих. Вычислите минимальные и максимальные веса для каждого пола и курения комбинации.
stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},... 'DataVars','Weight')
stats = Sex Smoker GroupCount min_Weight max_Weight Female_0 Female false 40 111 147 Female_1 Female true 13 115 146 Male_0 Male false 26 158 194 Male_1 Male true 21 164 202
Массив набора данных, stats
, имеет строку наблюдения для каждой комбинации уровней Sex
и Smoker
в исходных данных.