Statistics and Machine Learning Toolbox™ поддерживает следующие типы данных для входных параметров:
Числовые скаляры, векторы, матрицы или массивы, имеющие один - или записи с двойной точностью. Эти формы данных имеют тип данных single или double. Примеры включают переменные отклика, переменные прогноза и числовые значения.
Массивы ячеек из символьных векторов; символ, строка, логические, или категориальные массивы; или числовые векторы для категориальных данных о группировке представления переменных. Эти формы данных имеют типы данных cell (в частности cellstr), char, string, logical, categorical, и single или double, соответственно. Примером является массив меток класса в машинном обучении.
Можно также использовать номинальные или порядковые массивы для категориальных данных. Однако nominal и типы данных ordinal могут быть удалены в будущем релизе. Чтобы работать с номинальными или порядковыми категориальными данными, используйте тип данных categorical вместо этого.
Можно использовать целые числа со знаком или беззнаковое целое, например, int8 или uint8. Однако:
Функции оценки не могут поддержать целое число со знаком или типы данных беззнаковых целых чисел для негруппировки данных.
Если вы переделываете single или double числовой вектор, содержащий значения NaN к целому числу со знаком или беззнаковому целому, то программное обеспечение преобразовывает элементы NaN в 0.
Некоторые функции поддерживают табличные массивы для гетерогенных данных (для получения дополнительной информации см. Таблицы (MATLAB)). Тип данных table содержит переменные любого из типов данных, ранее перечисленных. Пример смешан категориальные и числовые данные о предикторе для регрессионного анализа.
Для некоторых функций можно также использовать массивы набора данных для гетерогенных данных. Однако тип данных dataset может быть удален в будущем релизе. Чтобы работать с гетерогенными данными, используйте тип данных table, если функция оценки поддерживает его.
Функции, которые не поддерживают выборочные данные поддержки типов данных table типа single или double, например, матрицы.
Некоторые функции принимают входные параметры gpuArray так, чтобы они выполнились на графическом процессоре. Для полного списка функций Statistics and Machine Learning Toolbox, которые принимают gpuArrays, смотрите Функции с gpuArray Аргументами.
Некоторые функции принимают, что входные параметры tall массивов работают с большими наборами данных. Для полного списка функций Statistics and Machine Learning Toolbox, которые принимают длинные массивы, смотрите Поддержку Длинного массива, Указания по применению и Ограничения.
Некоторые функции принимают разреженные матрицы, т.е. матричный A, таким образом, что issparse(A) возвращает 1. Для функций, которые не принимают разреженные матрицы, переделайте данные к полной матрице при помощи full.
Statistics and Machine Learning Toolbox не поддерживает следующие типы данных:
Комплексные числа.
Пользовательские типы числовых данных, например, переменная, которая является двойной точностью и объектом.
Подписанные или числовые целые числа без знака для негруппировки данных, например, unint8 и int16.
Если вы задаете данные неподдерживаемого типа, то программное обеспечение может возвратить ошибку или неожиданные результаты.