Statistics and Machine Learning Toolbox™ поддерживает следующие типы данных для входных параметров:
Числовые скаляры, векторы, матрицы или массивы, имеющие один - или записи с двойной точностью. Эти формы данных имеют тип данных single
или double
. Примеры включают переменные отклика, переменные прогноза и числовые значения.
Массивы ячеек из символьных векторов; символ, строка, логические, или категориальные массивы; или числовые векторы для категориальных данных о группировке представления переменных. Эти формы данных имеют типы данных cell
(в частности cellstr
), char
, string
, logical
, categorical
, и single
или double
, соответственно. Примером является массив меток класса в машинном обучении.
Можно также использовать номинальные или порядковые массивы для категориальных данных. Однако nominal
и типы данных ordinal
могут быть удалены в будущем релизе. Чтобы работать с номинальными или порядковыми категориальными данными, используйте тип данных categorical
вместо этого.
Можно использовать целые числа со знаком или беззнаковое целое, например, int8
или uint8
. Однако:
Функции оценки не могут поддержать целое число со знаком или типы данных беззнаковых целых чисел для негруппировки данных.
Если вы переделываете single
или double
числовой вектор, содержащий значения NaN
к целому числу со знаком или беззнаковому целому, то программное обеспечение преобразовывает элементы NaN
в 0
.
Некоторые функции поддерживают табличные массивы для гетерогенных данных (для получения дополнительной информации см. Таблицы (MATLAB)). Тип данных table
содержит переменные любого из типов данных, ранее перечисленных. Пример смешан категориальные и числовые данные о предикторе для регрессионного анализа.
Для некоторых функций можно также использовать массивы набора данных для гетерогенных данных. Однако тип данных dataset
может быть удален в будущем релизе. Чтобы работать с гетерогенными данными, используйте тип данных table
, если функция оценки поддерживает его.
Функции, которые не поддерживают выборочные данные поддержки типов данных table
типа single
или double
, например, матрицы.
Некоторые функции принимают входные параметры gpuArray
так, чтобы они выполнились на графическом процессоре. Для полного списка функций Statistics and Machine Learning Toolbox, которые принимают gpuArrays, смотрите Функции с gpuArray Аргументами.
Некоторые функции принимают, что входные параметры tall
массивов работают с большими наборами данных. Для полного списка функций Statistics and Machine Learning Toolbox, которые принимают длинные массивы, смотрите Поддержку Длинного массива, Указания по применению и Ограничения.
Некоторые функции принимают разреженные матрицы, т.е. матричный A
, таким образом, что issparse(A)
возвращает 1
. Для функций, которые не принимают разреженные матрицы, переделайте данные к полной матрице при помощи full
.
Statistics and Machine Learning Toolbox не поддерживает следующие типы данных:
Комплексные числа.
Пользовательские типы числовых данных, например, переменная, которая является двойной точностью и объектом.
Подписанные или числовые целые числа без знака для негруппировки данных, например, unint8
и int16
.
Если вы задаете данные неподдерживаемого типа, то программное обеспечение может возвратить ошибку или неожиданные результаты.