exponenta event banner

Сводная статистика, сгруппированная по категориям

Примечание

nominal и ordinal типы данных массива не рекомендуются. Для представления упорядоченных и неупорядоченных дискретных нечисловых данных используйте тип данных Категориальные массивы.

Сводная статистика, сгруппированная по категориям

В этом примере показано, как вычислить сводную статистику, сгруппированную по уровням категориальной переменной. Можно вычислить сводную статистику групп для числового массива или массива наборов данных с помощью grpstats.

Загрузить данные образца.

load hospital

Массив наборов данных, hospital, имеет 7 переменных (столбцов) и 100 наблюдений (строк).

Вычислить сводную статистику по категориям.

Переменная Sex - номинальный массив с двумя уровнями, Male и Female. Вычислите минимальный и максимальный веса для каждого пола.

stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = 
              Sex       GroupCount    min_Weight    max_Weight
    Female    Female    53            111           147       
    Male      Male      47            158           202       

Массив наборов данных, stats, имеет наблюдения, соответствующие уровням переменной Sex. Переменная min_Weight содержит минимальный вес для каждой группы и переменную max_Weight содержит максимальный вес для каждой группы.

Вычисление сводной статистики по нескольким категориям.

Переменная Smoker является логическим массивом со значением 1 для курильщиков и ценность 0 для некурящих. Вычислите минимальный и максимальный веса для каждого пола и комбинации курения.

stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},...
                 'DataVars','Weight')
stats = 
                Sex       Smoker    GroupCount    min_Weight    max_Weight
    Female_0    Female    false     40            111           147       
    Female_1    Female    true      13            115           146       
    Male_0      Male      false     26            158           194       
    Male_1      Male      true      21            164           202       

Массив наборов данных, stats, имеет строку наблюдения для каждой комбинации уровней Sex и Smoker в исходных данных.

См. также

| |

Связанные примеры

Подробнее