Примечание
The nominal и ordinal типы данных массива не рекомендованы. Чтобы представлять упорядоченные и неупорядоченные дискретные нечисловые данные, используйте вместо этого тип данных Категориальные Массивы.
В этом примере показано, как объединить категории в номинальный или порядковый массив с помощью mergelevels. Это полезно для свертывания категорий с небольшим количеством наблюдений.
Загрузите выборочные данные.
load carsmallСоздайте номинальный массив.
Переменная Origin - символьный массив, содержащий страну источника для 100 автомобилей-образцов. Преобразование Origin в номинальный массив.
Origin = nominal(Origin); getlevels(Origin)
ans = 1x6 nominal
France Germany Italy Japan Sweden USA
В данных есть шесть уникальных стран источника.
Сведите в таблицу счетчики категорий.
Исследуйте элементы номинального массива.
tabulate(Origin)
Value Count Percent
France 4 4.00%
Germany 9 9.00%
Italy 1 1.00%
Japan 15 15.00%
Sweden 2 2.00%
USA 69 69.00%
В каждой европейской стране наблюдений относительно мало.
Объединить категории.
Объедините категории France, Germany, Italy, и Sweden в одну категорию, называемую Europe.
Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},...
'Europe');
getlevels(Origin)ans = 1x3 nominal
Europe Japan USA
Переменная Origin теперь имеет только три уровня категорий.
Сведите в таблицу счетчики категорий.
Исследуйте элементы объединенных категорий.
tabulate(Origin)
Value Count Percent
Europe 16 16.00%
Japan 15 15.00%
USA 69 69.00%
Категория Europe имеет 16% наблюдений, которые ранее были распределены по четырем странам.