exponenta event banner

Объединить уровни категорий

Примечание

nominal и ordinal типы данных массива не рекомендуются. Для представления упорядоченных и неупорядоченных дискретных нечисловых данных используйте тип данных Категориальные массивы.

Объединить уровни категорий

В этом примере показано, как объединить категории в номинальном или порядковом массиве с помощью mergelevels. Это полезно для свертывания категорий с небольшим количеством наблюдений.

Загрузить данные образца.

load carsmall

Создайте номинальный массив.

Переменная Origin представляет собой символьный массив, содержащий страну происхождения для 100 образцов автомобилей. Новообращенный Origin в номинальный массив.

Origin = nominal(Origin);
getlevels(Origin)
ans = 1x6 nominal
     France      Germany      Italy      Japan      Sweden      USA 

Данные содержат шесть уникальных стран происхождения.

Количество категорий таблицы.

Изучите элементы номинального массива.

tabulate(Origin)
    Value    Count   Percent
   France        4      4.00%
  Germany        9      9.00%
    Italy        1      1.00%
    Japan       15     15.00%
   Sweden        2      2.00%
      USA       69     69.00%

В каждой европейской стране наблюдается относительно мало наблюдений.

Объединить категории.

Объединение категорий France, Germany, Italy, и Sweden в одну категорию с именем Europe.

Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},...
                     'Europe');
getlevels(Origin)
ans = 1x3 nominal
     Europe      Japan      USA 

Переменная Origin теперь имеет только три уровня категории.

Количество категорий таблицы.

Ознакомьтесь с элементами объединенных категорий.

tabulate(Origin)
   Value    Count   Percent
  Europe       16     16.00%
   Japan       15     15.00%
     USA       69     69.00%

Категория Europe имеет 16% наблюдений, которые ранее были распределены по четырем странам.

См. также

|

Связанные примеры

Подробнее