Statistics and Machine Learning Toolbox™ поддерживает следующие типы данных для входных параметров:
Числовые скаляры, векторы, матрицы или массивы, имеющие одинарные или двойные значения точности. Эти формы данных имеют тип данных single или double. Примеры включают переменные отклика, переменные предиктора и числовые значения.
Массивы ячеек из символьных векторов; символьный, строковый, логический или категориальные массивы; или числовые векторы для категориальных переменных, представляющих данные группировки. Эти формы данных имеют типы данных cell (конкретно cellstr), char, string, logical, categorical, и single или double, соответственно. Примером является массив меток классов в машинном обучении.
Для категориальных данных можно также использовать номинальные или порядковые массивы. Однако nominal и ordinal типы данных не рекомендуются. Для работы с номинальными или порядковыми категориальными данными используйте categorical вместо этого тип данных.
Можно использовать знаковые или беззнаковые целые числа, например, int8 или uint8. Однако:
Функции оценки могут не поддерживать подписанные или беззнаковые целочисленные типы данных для негруппированных данных.
Если вы пересчитываете single или double числовой вектор, содержащий NaN значения в целое число со знаком или без знака, затем программное обеспечение преобразует NaN элементы, к 0.
Некоторые функции поддерживают табличные массивы для неоднородных данных (для получения дополнительной информации см. Таблицы). The table тип данных содержит переменные любого из перечисленных ранее типов данных. Примером являются смешанные категориальные и численные данные предиктора для регрессионного анализа.
Для некоторых функций можно также использовать массивы набора данных для гетерогенных данных. Однако dataset тип данных не рекомендуется. Для работы с неоднородными данными используйте table тип данных, если функция оценки поддерживает его.
Функции, которые не поддерживают table тип данных поддерживает выборочные данные типа single или double, например, матрицы.
Некоторые функции принимают gpuArray (Parallel Computing Toolbox) входные параметры так, чтобы они выполнялись на графическом процессоре. Полный список функций Statistics and Machine Learning Toolbox, принимающих массивы графических процессоров, см. в Списке функций (GPU Arrays).
Некоторые функции принимают tall входные параметры массива для работы с большими наборами данных. Полный список функций Statistics and Machine Learning Toolbox, которые принимают длинные массивы, см. в Списке функций (Длинные массивы).
Некоторые функции принимают разреженные матрицы, т.е. матрицу A таким образом issparse(A) возвращает 1. Для функций, которые не принимают разреженные матрицы, пересчитайте данные в полную матрицу с помощью full.
Statistics and Machine Learning Toolbox не поддерживает следующие типы данных:
Комплексные числа.
Пользовательские типы числовых данных, например, переменная с двойной точностью и объект.
Подписанные или беззнаковые числовые целые числа для негруппированных данных, например unint8 и int16.
Примечание
Если вы задаете данные неподдерживаемого типа, то программа может вернуть ошибку или неожиданные результаты.