Примечание
nominal и ordinal типы данных массива не рекомендуются. Для представления упорядоченных и неупорядоченных дискретных нечисловых данных используйте тип данных Категориальные массивы.
При работе с категориальными переменными и их уровнями вы столкнетесь с некоторыми типичными проблемами. В этой таблице представлены функции, которые можно использовать с номинальными или порядковыми массивами для управления уровнями категорий. Для дополнительных функций введите methods nominal или methods ordinal в командной строке или см. nominal и ordinal справочные страницы.
| Задача | Функция |
|---|---|
| Добавить новые уровни категорий | addlevels |
| Удалить уровни категорий | droplevels |
| Объединить уровни категорий | mergelevels |
| Переупорядочить уровни категорий | reorderlevels |
| Подсчитать количество наблюдений в каждой категории | levelcounts |
| Изменение метки или имени уровней категорий | setlabels |
| Создание фактора взаимодействия | times |
| Поиск наблюдений, не относящихся к определенной категории | isundefined |
В различных статистических анализах можно использовать номинальные и порядковые массивы. Например, может потребоваться вычислить описательную статистику для данных, сгруппированных по уровням категорий, провести статистические тесты на различия между средними категориями или выполнить регрессионный анализ с использованием категориальных предикторов.
Функции Toolbox™ статистики и машинного обучения, которые принимают переменную группировки в качестве входного аргумента, принимают номинальные и порядковые массивы. Сюда входят описательные функции, такие как:
Можно также использовать номинальные и порядковые массивы в качестве входных аргументов для функций и методов анализа, основанных на моделях, таких как:
При использовании номинального или порядкового массива в качестве предиктора в этих функциях аппроксимирующая функция автоматически распознает категориальный предиктор и создает соответствующие фиктивные переменные индикатора для анализа. Кроме того, можно создать собственные фиктивные переменные индикатора с помощью dummyvar.
Уровни категориальных переменных часто определяются как текст, который может быть дорогостоящим для хранения и манипулирования в массиве ячеек векторов символов или char массив. Номинальные и порядковые массивы отдельно хранят членство в категориях и метки категорий, значительно сокращая объем памяти, необходимый для хранения переменной.
Например, загрузите несколько образцов данных:
load('fisheriris')species является массивом ячеек символьных векторов, требующих 19 300 байт памяти.

Новообращенный species в номинальный массив:
species = nominal(species);

Для хранения переменной требуется 95% меньше памяти.