Массив, который содержит значения, присвоенные категориям
categorical является типом данных, который присваивает значения конечному набору дискретных категорий, таких как High, Med, и Low. Эти категории могут иметь математическое упорядоченное расположение, который вы задаете, такой как High > Med > Low, но это не обязательно. Категориальный массив обеспечивает эффективное хранение и удобную манипуляцию нечисловыми данными, а также сохраняет значимые имена для значений. Обычно категориальные массивы используются для задания групп строк в таблице.
B = categorical( создает категориальный массив из массива A)A. Категории B отсортированные уникальные значения из A.
B = categorical( создает по одной категории для каждого значения в A,valueset)valueset. Категории B находятся в том же порядке, что и значения valueset.
Можно использовать valueset для включения категорий значений, отсутствующих в A. И наоборот, если A содержит любые значения, отсутствующие в valueset, затем соответствующие элементы B не определены.
B = categorical( создает категориальный массив с дополнительными опциями, заданными одним или несколькими A,___,Name,Value)Name,Value аргументы в виде пар. Можно включать любой из входных параметров в предыдущие синтаксисы.
Для примера, чтобы указать, что категории имеют математическое упорядоченное расположение, задайте 'Ordinal',true.
Список функций, которые принимают или возвращают категориальные массивы, см. в разделе Категориальные массивы.
Если массив входа имеет числовые, datetime или значения длительности, которые слишком близки друг к другу, то categorical функция обрезает их, чтобы повторить значения. Для примера, categorical([1 1.00001]) обрезает второй элемент массива входа. Чтобы создать категории из числовых данных, используйте discretize функция.
Вы также можете сгруппировать числовые данные в категории, используя discretize.