Toolbox™ статистики и машинного обучения поддерживает следующие типы данных для входных аргументов:
Числовые скаляры, векторы, матрицы или массивы, имеющие записи с одинарной или двойной точностью. Эти формы данных имеют тип данных single или double. Примеры включают переменные ответа, переменные предиктора и числовые значения.
Массивы ячеек символьных векторов; символьные, строковые, логические или категориальные массивы; или числовые векторы для категориальных переменных, представляющих данные группировки. Эти формы данных имеют типы данных cell (конкретно cellstr), char, string, logical, categorical, и single или doubleсоответственно. Примером является массив меток классов в машинном обучении.
Для категориальных данных можно также использовать номинальные или порядковые массивы. Тем не менее, nominal и ordinal типы данных не рекомендуются. Для работы с номинальными или порядковыми категориальными данными используйте categorical вместо этого тип данных.
Можно использовать подписанные или неподписанные целые числа, например, int8 или uint8. Однако:
Функции оценки могут не поддерживать целочисленные типы данных со знаком или без знака для данных, не входящих в группу.
Если изменить single или double числовой вектор, содержащий NaN в целое число со знаком или без знака, затем программное обеспечение преобразует NaN элементы в 0.
Некоторые функции поддерживают табличные массивы для разнородных данных (подробнее см. Таблицы). table содержит переменные любого из ранее перечисленных типов данных. Примером являются смешанные категориальные и численные данные предиктора для регрессионного анализа.
Для некоторых функций можно также использовать массивы наборов данных для разнородных данных. Тем не менее, dataset тип данных не рекомендуется. Для работы с разнородными данными используйте table тип данных, если функция оценки его поддерживает.
Функции, не поддерживающие table тип данных поддерживает образец данных типа single или double, например, матрицы.
Некоторые функции принимают gpuArray Входные аргументы (Parallel Computing Toolbox) выполняются на графическом процессоре. Полный список функций Statistics и Machine Learning Toolbox, принимающих массивы GPU, см. в разделе Список функций (массивы GPU).
Некоторые функции принимают tall входные аргументы массива для работы с большими наборами данных. Полный список функций Statistics и Machine Learning Toolbox, принимающих массивы tall, см. в разделе Список функций (массивы Tall).
Некоторые функции принимают разреженные матрицы, то есть матрицу A такой, что issparse(A) прибыль 1. Для функций, которые не принимают разреженные матрицы, пересчитайте данные в полную матрицу с помощью full.
Набор инструментов для статистики и машинного обучения не поддерживает следующие типы данных:
Комплексные числа.
Пользовательские числовые типы данных, например, переменная с двойной точностью и объект.
Подписанные или неподписанные числовые целые числа для данных, не входящих в группу, например, unint8 и int16.
Примечание
Если указать данные неподдерживаемого типа, программа может вернуть ошибку или непредвиденные результаты.