exponenta event banner

Поддерживаемые типы данных

Toolbox™ статистики и машинного обучения поддерживает следующие типы данных для входных аргументов:

  • Числовые скаляры, векторы, матрицы или массивы, имеющие записи с одинарной или двойной точностью. Эти формы данных имеют тип данных single или double. Примеры включают переменные ответа, переменные предиктора и числовые значения.

  • Массивы ячеек символьных векторов; символьные, строковые, логические или категориальные массивы; или числовые векторы для категориальных переменных, представляющих данные группировки. Эти формы данных имеют типы данных cell (конкретно cellstr), char, string, logical, categorical, и single или doubleсоответственно. Примером является массив меток классов в машинном обучении.

    • Для категориальных данных можно также использовать номинальные или порядковые массивы. Тем не менее, nominal и ordinal типы данных не рекомендуются. Для работы с номинальными или порядковыми категориальными данными используйте categorical вместо этого тип данных.

    • Можно использовать подписанные или неподписанные целые числа, например, int8 или uint8. Однако:

      • Функции оценки могут не поддерживать целочисленные типы данных со знаком или без знака для данных, не входящих в группу.

      • Если изменить single или double числовой вектор, содержащий NaN в целое число со знаком или без знака, затем программное обеспечение преобразует NaN элементы в 0.

  • Некоторые функции поддерживают табличные массивы для разнородных данных (подробнее см. Таблицы). table содержит переменные любого из ранее перечисленных типов данных. Примером являются смешанные категориальные и численные данные предиктора для регрессионного анализа.

    • Для некоторых функций можно также использовать массивы наборов данных для разнородных данных. Тем не менее, dataset тип данных не рекомендуется. Для работы с разнородными данными используйте table тип данных, если функция оценки его поддерживает.

    • Функции, не поддерживающие table тип данных поддерживает образец данных типа single или double, например, матрицы.

  • Некоторые функции принимают gpuArray Входные аргументы (Parallel Computing Toolbox) выполняются на графическом процессоре. Полный список функций Statistics и Machine Learning Toolbox, принимающих массивы GPU, см. в разделе Список функций (массивы GPU).

  • Некоторые функции принимают tall входные аргументы массива для работы с большими наборами данных. Полный список функций Statistics и Machine Learning Toolbox, принимающих массивы tall, см. в разделе Список функций (массивы Tall).

  • Некоторые функции принимают разреженные матрицы, то есть матрицу A такой, что issparse(A) прибыль 1. Для функций, которые не принимают разреженные матрицы, пересчитайте данные в полную матрицу с помощью full.

Набор инструментов для статистики и машинного обучения не поддерживает следующие типы данных:

  • Комплексные числа.

  • Пользовательские числовые типы данных, например, переменная с двойной точностью и объект.

  • Подписанные или неподписанные числовые целые числа для данных, не входящих в группу, например, unint8 и int16.

Примечание

Если указать данные неподдерживаемого типа, программа может вернуть ошибку или непредвиденные результаты.