Поддерживаемые типы данных

Statistics and Machine Learning Toolbox™ поддерживает следующие типы данных для входных параметров:

  • Числовые скаляры, векторы, матрицы или массивы, имеющие одинарные или двойные значения точности. Эти формы данных имеют тип данных single или double. Примеры включают переменные отклика, переменные предиктора и числовые значения.

  • Массивы ячеек из символьных векторов; символьный, строковый, логический или категориальные массивы; или числовые векторы для категориальных переменных, представляющих данные группировки. Эти формы данных имеют типы данных cell (конкретно cellstr), char, string, logical, categorical, и single или double, соответственно. Примером является массив меток классов в машинном обучении.

    • Для категориальных данных можно также использовать номинальные или порядковые массивы. Однако nominal и ordinal типы данных не рекомендуются. Для работы с номинальными или порядковыми категориальными данными используйте categorical вместо этого тип данных.

    • Можно использовать знаковые или беззнаковые целые числа, например, int8 или uint8. Однако:

      • Функции оценки могут не поддерживать подписанные или беззнаковые целочисленные типы данных для негруппированных данных.

      • Если вы пересчитываете single или double числовой вектор, содержащий NaN значения в целое число со знаком или без знака, затем программное обеспечение преобразует NaN элементы, к 0.

  • Некоторые функции поддерживают табличные массивы для неоднородных данных (для получения дополнительной информации см. Таблицы). The table тип данных содержит переменные любого из перечисленных ранее типов данных. Примером являются смешанные категориальные и численные данные предиктора для регрессионного анализа.

    • Для некоторых функций можно также использовать массивы набора данных для гетерогенных данных. Однако dataset тип данных не рекомендуется. Для работы с неоднородными данными используйте table тип данных, если функция оценки поддерживает его.

    • Функции, которые не поддерживают table тип данных поддерживает выборочные данные типа single или double, например, матрицы.

  • Некоторые функции принимают gpuArray (Parallel Computing Toolbox) входные параметры так, чтобы они выполнялись на графическом процессоре. Полный список функций Statistics and Machine Learning Toolbox, принимающих массивы графических процессоров, см. в Списке функций (GPU Arrays).

  • Некоторые функции принимают tall входные параметры массива для работы с большими наборами данных. Полный список функций Statistics and Machine Learning Toolbox, которые принимают длинные массивы, см. в Списке функций (Длинные массивы).

  • Некоторые функции принимают разреженные матрицы, т.е. матрицу A таким образом issparse(A) возвращает 1. Для функций, которые не принимают разреженные матрицы, пересчитайте данные в полную матрицу с помощью full.

Statistics and Machine Learning Toolbox не поддерживает следующие типы данных:

  • Комплексные числа.

  • Пользовательские типы числовых данных, например, переменная с двойной точностью и объект.

  • Подписанные или беззнаковые числовые целые числа для негруппированных данных, например unint8 и int16.

Примечание

Если вы задаете данные неподдерживаемого типа, то программа может вернуть ошибку или неожиданные результаты.

Для просмотра документации необходимо авторизоваться на сайте