Примечание
nominal и ordinal типы данных массива не рекомендуются. Для представления упорядоченных и неупорядоченных дискретных нечисловых данных используйте тип данных Категориальные массивы.
В этом примере показано, как объединить категории в номинальном или порядковом массиве с помощью mergelevels. Это полезно для свертывания категорий с небольшим количеством наблюдений.
Загрузить данные образца.
load carsmallСоздайте номинальный массив.
Переменная Origin представляет собой символьный массив, содержащий страну происхождения для 100 образцов автомобилей. Новообращенный Origin в номинальный массив.
Origin = nominal(Origin); getlevels(Origin)
ans = 1x6 nominal
France Germany Italy Japan Sweden USA
Данные содержат шесть уникальных стран происхождения.
Количество категорий таблицы.
Изучите элементы номинального массива.
tabulate(Origin)
Value Count Percent
France 4 4.00%
Germany 9 9.00%
Italy 1 1.00%
Japan 15 15.00%
Sweden 2 2.00%
USA 69 69.00%
В каждой европейской стране наблюдается относительно мало наблюдений.
Объединить категории.
Объединение категорий France, Germany, Italy, и Sweden в одну категорию с именем Europe.
Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},...
'Europe');
getlevels(Origin)ans = 1x3 nominal
Europe Japan USA
Переменная Origin теперь имеет только три уровня категории.
Количество категорий таблицы.
Ознакомьтесь с элементами объединенных категорий.
tabulate(Origin)
Value Count Percent
Europe 16 16.00%
Japan 15 15.00%
USA 69 69.00%
Категория Europe имеет 16% наблюдений, которые ранее были распределены по четырем странам.