Примечание
The nominal
и ordinal
типы данных массива не рекомендованы. Чтобы представлять упорядоченные и неупорядоченные дискретные нечисловые данные, используйте вместо этого тип данных Категориальные Массивы.
В этом примере показано, как объединить категории в номинальный или порядковый массив с помощью mergelevels
. Это полезно для свертывания категорий с небольшим количеством наблюдений.
Загрузите выборочные данные.
load carsmall
Создайте номинальный массив.
Переменная Origin
- символьный массив, содержащий страну источника для 100 автомобилей-образцов. Преобразование Origin
в номинальный массив.
Origin = nominal(Origin); getlevels(Origin)
ans = 1x6 nominal
France Germany Italy Japan Sweden USA
В данных есть шесть уникальных стран источника.
Сведите в таблицу счетчики категорий.
Исследуйте элементы номинального массива.
tabulate(Origin)
Value Count Percent France 4 4.00% Germany 9 9.00% Italy 1 1.00% Japan 15 15.00% Sweden 2 2.00% USA 69 69.00%
В каждой европейской стране наблюдений относительно мало.
Объединить категории.
Объедините категории France
, Germany
, Italy
, и Sweden
в одну категорию, называемую Europe
.
Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},... 'Europe'); getlevels(Origin)
ans = 1x3 nominal
Europe Japan USA
Переменная Origin
теперь имеет только три уровня категорий.
Сведите в таблицу счетчики категорий.
Исследуйте элементы объединенных категорий.
tabulate(Origin)
Value Count Percent Europe 16 16.00% Japan 15 15.00% USA 69 69.00%
Категория Europe
имеет 16% наблюдений, которые ранее были распределены по четырем странам.