exponenta event banner

Преимущества использования номинальных и порядковых массивов

Примечание

nominal и ordinal типы данных массива не рекомендуются. Для представления упорядоченных и неупорядоченных дискретных нечисловых данных используйте тип данных Категориальные массивы.

Управление уровнями категорий

При работе с категориальными переменными и их уровнями вы столкнетесь с некоторыми типичными проблемами. В этой таблице представлены функции, которые можно использовать с номинальными или порядковыми массивами для управления уровнями категорий. Для дополнительных функций введите methods nominal или methods ordinal в командной строке или см. nominal и ordinal справочные страницы.

ЗадачаФункция
Добавить новые уровни категорий addlevels
Удалить уровни категорийdroplevels
Объединить уровни категорийmergelevels
Переупорядочить уровни категорийreorderlevels
Подсчитать количество наблюдений в каждой категорииlevelcounts
Изменение метки или имени уровней категорийsetlabels
Создание фактора взаимодействияtimes
Поиск наблюдений, не относящихся к определенной категорииisundefined

Анализ с использованием номинальных и порядковых массивов

В различных статистических анализах можно использовать номинальные и порядковые массивы. Например, может потребоваться вычислить описательную статистику для данных, сгруппированных по уровням категорий, провести статистические тесты на различия между средними категориями или выполнить регрессионный анализ с использованием категориальных предикторов.

Функции Toolbox™ статистики и машинного обучения, которые принимают переменную группировки в качестве входного аргумента, принимают номинальные и порядковые массивы. Сюда входят описательные функции, такие как:

Можно также использовать номинальные и порядковые массивы в качестве входных аргументов для функций и методов анализа, основанных на моделях, таких как:

При использовании номинального или порядкового массива в качестве предиктора в этих функциях аппроксимирующая функция автоматически распознает категориальный предиктор и создает соответствующие фиктивные переменные индикатора для анализа. Кроме того, можно создать собственные фиктивные переменные индикатора с помощью dummyvar.

Сокращение требований к памяти

Уровни категориальных переменных часто определяются как текст, который может быть дорогостоящим для хранения и манипулирования в массиве ячеек векторов символов или char массив. Номинальные и порядковые массивы отдельно хранят членство в категориях и метки категорий, значительно сокращая объем памяти, необходимый для хранения переменной.

Например, загрузите несколько образцов данных:

load('fisheriris')
Переменная species является массивом ячеек символьных векторов, требующих 19 300 байт памяти.

Новообращенный species в номинальный массив:

species = nominal(species);

Для хранения переменной требуется 95% меньше памяти.

См. также

|

Связанные примеры

Подробнее