Объединить уровни категорий

Примечание

The nominal и ordinal типы данных массива не рекомендованы. Чтобы представлять упорядоченные и неупорядоченные дискретные нечисловые данные, используйте вместо этого тип данных Категориальные Массивы.

Объединить уровни категорий

В этом примере показано, как объединить категории в номинальный или порядковый массив с помощью mergelevels. Это полезно для свертывания категорий с небольшим количеством наблюдений.

Загрузите выборочные данные.

load carsmall

Создайте номинальный массив.

Переменная Origin - символьный массив, содержащий страну источника для 100 автомобилей-образцов. Преобразование Origin в номинальный массив.

Origin = nominal(Origin);
getlevels(Origin)
ans = 1x6 nominal
     France      Germany      Italy      Japan      Sweden      USA 

В данных есть шесть уникальных стран источника.

Сведите в таблицу счетчики категорий.

Исследуйте элементы номинального массива.

tabulate(Origin)
    Value    Count   Percent
   France        4      4.00%
  Germany        9      9.00%
    Italy        1      1.00%
    Japan       15     15.00%
   Sweden        2      2.00%
      USA       69     69.00%

В каждой европейской стране наблюдений относительно мало.

Объединить категории.

Объедините категории France, Germany, Italy, и Sweden в одну категорию, называемую Europe.

Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},...
                     'Europe');
getlevels(Origin)
ans = 1x3 nominal
     Europe      Japan      USA 

Переменная Origin теперь имеет только три уровня категорий.

Сведите в таблицу счетчики категорий.

Исследуйте элементы объединенных категорий.

tabulate(Origin)
   Value    Count   Percent
  Europe       16     16.00%
   Japan       15     15.00%
     USA       69     69.00%

Категория Europe имеет 16% наблюдений, которые ранее были распределены по четырем странам.

См. также

|

Похожие примеры

Подробнее о