Итоговая статистика, сгруппированная по категориям

Примечание

nominal и ordinal типы данных массива не рекомендуются. Чтобы представлять упорядоченный и неупорядоченные дискретные, нечисловые данные, используйте тип данных Категориальных массивов вместо этого.

Итоговая статистика, сгруппированная по категориям

В этом примере показано, как вычислить итоговую статистику, сгруппированную уровнями категориальной переменной. Можно вычислить статистику сводных данных группы для числового массива или массива набора данных с помощью grpstats.

Загрузка демонстрационных данных.

load hospital

Массив набора данных, hospital, имеет 7 переменных (столбцы) и 100 наблюдений (строки).

Вычислите итоговую статистику по категориям.

Переменная Sex номинальный массив с двумя уровнями, Male и Female. Вычислите минимальные и максимальные веса для каждого пола.

stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = 
              Sex       GroupCount    min_Weight    max_Weight
    Female    Female    53            111           147       
    Male      Male      47            158           202       

Массив набора данных, stats, имеет наблюдения, соответствующие уровням переменной Sex. Переменная min_Weight содержит минимальный вес для каждой группы и переменную max_Weight содержит максимальный вес для каждой группы.

Вычислите итоговую статистику несколькими категориями.

Переменная Smoker логический массив со значением 1 для курильщиков и значения 0 для некурящих. Вычислите минимальные и максимальные веса для каждого пола и курения комбинации.

stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},...
                 'DataVars','Weight')
stats = 
                Sex       Smoker    GroupCount    min_Weight    max_Weight
    Female_0    Female    false     40            111           147       
    Female_1    Female    true      13            115           146       
    Male_0      Male      false     26            158           194       
    Male_1      Male      true      21            164           202       

Массив набора данных, stats, имеет строку наблюдения для каждой комбинации уровней Sex и Smoker в исходных данных.

Смотрите также

| |

Связанные примеры

Больше о