Statistics and Machine Learning Toolbox™ поддерживает следующие типы данных для входных параметров:
Числовые скаляры, векторы, матрицы или массивы, имеющие одинарные или двойные значения точности. Эти формы данных имеют тип данных single
или double
. Примеры включают переменные отклика, переменные предиктора и числовые значения.
Массивы ячеек из символьных векторов; символьный, строковый, логический или категориальные массивы; или числовые векторы для категориальных переменных, представляющих данные группировки. Эти формы данных имеют типы данных cell
(конкретно cellstr
), char
, string
, logical
, categorical
, и single
или double
, соответственно. Примером является массив меток классов в машинном обучении.
Для категориальных данных можно также использовать номинальные или порядковые массивы. Однако nominal
и ordinal
типы данных не рекомендуются. Для работы с номинальными или порядковыми категориальными данными используйте categorical
вместо этого тип данных.
Можно использовать знаковые или беззнаковые целые числа, например, int8
или uint8
. Однако:
Функции оценки могут не поддерживать подписанные или беззнаковые целочисленные типы данных для негруппированных данных.
Если вы пересчитываете single
или double
числовой вектор, содержащий NaN
значения в целое число со знаком или без знака, затем программное обеспечение преобразует NaN
элементы, к 0
.
Некоторые функции поддерживают табличные массивы для неоднородных данных (для получения дополнительной информации см. Таблицы). The table
тип данных содержит переменные любого из перечисленных ранее типов данных. Примером являются смешанные категориальные и численные данные предиктора для регрессионного анализа.
Для некоторых функций можно также использовать массивы набора данных для гетерогенных данных. Однако dataset
тип данных не рекомендуется. Для работы с неоднородными данными используйте table
тип данных, если функция оценки поддерживает его.
Функции, которые не поддерживают table
тип данных поддерживает выборочные данные типа single
или double
, например, матрицы.
Некоторые функции принимают gpuArray
(Parallel Computing Toolbox) входные параметры так, чтобы они выполнялись на графическом процессоре. Полный список функций Statistics and Machine Learning Toolbox, принимающих массивы графических процессоров, см. в Списке функций (GPU Arrays).
Некоторые функции принимают tall
входные параметры массива для работы с большими наборами данных. Полный список функций Statistics and Machine Learning Toolbox, которые принимают длинные массивы, см. в Списке функций (Длинные массивы).
Некоторые функции принимают разреженные матрицы, т.е. матрицу A
таким образом issparse(A)
возвращает 1
. Для функций, которые не принимают разреженные матрицы, пересчитайте данные в полную матрицу с помощью full
.
Statistics and Machine Learning Toolbox не поддерживает следующие типы данных:
Комплексные числа.
Пользовательские типы числовых данных, например, переменная с двойной точностью и объект.
Подписанные или беззнаковые числовые целые числа для негруппированных данных, например unint8
и int16
.
Примечание
Если вы задаете данные неподдерживаемого типа, то программа может вернуть ошибку или неожиданные результаты.