Массив, который содержит значения, присвоенные категориям
categorical
тип данных, который присваивает значения конечному множеству дискретных категорий, такие как High
, Med
, и Low
. Эти категории могут иметь математическое упорядоченное расположение, чтобы вы задали, такие как High > Med > Low
, но это не требуется. Категориальный массив обеспечивает эффективное устройство хранения данных и удобную манипуляцию нечисловых данных, также обеспечивая понятные имена для значений. Общее использование категориальных массивов должно задать группы строк в таблице.
B = categorical(
создает категориальный массив из массива A
)A
. Категории B
отсортированные уникальные значения от A
.
B = categorical(
создает одну категорию для каждого значения в A
,valueset
)valueset
. Категории B
находятся в том же порядке как значения valueset
.
Можно использовать valueset
включать категории для значений, не существующих в A
. С другой стороны, если A
содержит любые значения, не существующие в valueset
, затем соответствующие элементы B
не определены.
B = categorical(
создает категориальный массив с дополнительными опциями, заданными одним или несколькими A
,___,Name,Value
)Name,Value
парные аргументы. Можно включать любой из входных параметров в предыдущих синтаксисах.
Например, чтобы указать, что категории имеют математическое упорядоченное расположение, задайте 'Ordinal',true
.
Для списка функций, которые принимают или возвращают категориальные массивы, см. Категориальные массивы.
Если входной массив имеет числовой, datetime или значения длительности, которые слишком близки вместе, то categorical
функция обрезает их, чтобы скопировать значения. Например, categorical([1 1.00001])
обрезает второй элемент входного массива. Чтобы создать категории из числовых данных, используйте discretize
функция.
Также можно сгруппировать числовые данные в использование категорий discretize
.