Statistics and Machine Learning Toolbox™ поддерживает следующие типы данных для входных параметров:
Числовые скаляры, векторы, матрицы или массивы, имеющие один - или записи с двойной точностью. Эти формы данных имеют тип данных single
или double
. Примеры включают переменные отклика, переменные предикторы и числовые значения.
Массивы ячеек из символьных векторов; символ, строка, логические, или категориальные массивы; или числовые векторы для категориальных данных о группировке представления переменных. Эти формы данных имеют типы данных cell
(в частности cellstr
'char'
Строка
логический
категориальный
, и single
или double
, соответственно. Примером является массив меток класса в машинном обучении.
Можно также использовать номинальные или порядковые массивы в категориальных данных. Однако nominal
и ordinal
типы данных не рекомендуются. Чтобы работать с номинальными или порядковыми категориальными данными, используйте categorical
тип данных вместо этого.
Можно использовать целые числа со знаком или беззнаковое целое, например, int8
или uint8
. Однако:
Функции оценки не могут поддержать целое число со знаком или типы данных беззнаковых целых чисел для негруппировки данных.
Если вы переделываете single
или double
числовой вектор, содержащий NaN
значения к целому числу со знаком или беззнаковому целому, затем программное обеспечение преобразует NaN
элементы к 0
.
Некоторые функции поддерживают табличные массивы для гетерогенных данных (для получения дополнительной информации см. Таблицы (MATLAB)). table
тип данных содержит переменные любого из типов данных, ранее перечисленных. Пример смешан категориальные и числовые данные о предикторе для регрессионного анализа.
Для некоторых функций можно также использовать массивы набора данных в гетерогенных данных. Однако dataset
тип данных не рекомендуется. Чтобы работать с гетерогенными данными, используйте table
тип данных, если функция оценки поддерживает его.
Функции, которые не поддерживают table
выборочные данные поддержки типов данных типа single
или double
, например, матрицы.
Некоторые функции принимают gpuArray
входные параметры так, чтобы они выполнились на графическом процессоре. Для полного списка функций Statistics and Machine Learning Toolbox, которые принимают массивы графического процессора, см. Функциональный Список (Массивы графического процессора).
Некоторые функции принимают tall
входные параметры массивов, чтобы работать с большими наборами данных. Для полного списка функций Statistics and Machine Learning Toolbox, которые принимают длинные массивы, смотрите Поддержку Длинного массива, Указания по применению и Ограничения.
Некоторые функции принимают разреженные матрицы, т.е. матричный A
таким образом, что issparse(A)
возвращает 1
. Для функций, которые не принимают разреженные матрицы, переделайте данные к полной матрице при помощи full
.
Statistics and Machine Learning Toolbox не поддерживает следующие типы данных:
Комплексные числа.
Пользовательские типы числовых данных, например, переменная, которая является двойной точностью и объектом.
Подписанные или числовые целые числа без знака для негруппировки данных, например, unint8
и int16
.
Если вы задаете данные неподдерживаемого типа, то программное обеспечение может возвратить ошибку или неожиданные результаты.