Итоговая статистика, сгруппированная по категориям

Примечание

The nominal и ordinal типы данных массива не рекомендованы. Чтобы представлять упорядоченные и неупорядоченные дискретные нечисловые данные, используйте вместо этого тип данных Категориальные Массивы.

Итоговая статистика, сгруппированная по категориям

В этом примере показано, как вычислить итоговую статистику, сгруппированную по уровням категориальной переменной. Можно вычислить сводную статистику групп для числового массива или массива набора данных с помощью grpstats.

Загрузите выборочные данные.

load hospital

Массив набора данных, hospital, имеет 7 переменных (столбцов) и 100 наблюдений (строк).

Вычислите итоговую статистику по категориям.

Переменная Sex - номинальный массив с двумя уровнями, Male и Female. Вычислите минимальный и максимальный веса для каждого пола.

stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = 
              Sex       GroupCount    min_Weight    max_Weight
    Female    Female    53            111           147       
    Male      Male      47            158           202       

Массив набора данных, stats, имеет наблюдения, соответствующие уровням переменной Sex. Переменная min_Weight содержит минимальный вес для каждой группы и переменную max_Weight содержит максимальный вес для каждой группы.

Вычислите сводную статистику по нескольким категориям.

Переменная Smoker - логический массив со значением 1 для курильщиков и ценностных 0 для некурящих. Вычислите минимальный и максимальный веса для каждого пола и комбинации курения.

stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},...
                 'DataVars','Weight')
stats = 
                Sex       Smoker    GroupCount    min_Weight    max_Weight
    Female_0    Female    false     40            111           147       
    Female_1    Female    true      13            115           146       
    Male_0      Male      false     26            158           194       
    Male_1      Male      true      21            164           202       

Массив набора данных, stats, имеет строку наблюдения для каждой комбинации уровней Sex и Smoker в исходных данных.

См. также

| |

Похожие примеры

Подробнее о