Массивы набора данных

Примечание

The dataset тип данных не рекомендуется. Для работы с неоднородными данными используйте MATLAB® table вместо этого тип данных. См. MATLAB table документация для получения дополнительной информации.

Что такое массивы набора данных?

Statistics and Machine Learning Toolbox™ имеет dataset arrays для хранения переменных с неоднородными типами данных. Например, можно объединить числовые данные, логические данные, массивы ячеек векторов символов и категориальные массивы в одну переменную массива набора данных.

В массиве набора данных каждая переменная (столбец) должна быть одним однородным типом данных, но различные переменные могут быть гетерогенными типами данных. Массив набора данных обычно интерпретируется как набор переменных, измеренных на многих модулях наблюдения. То есть каждая строка в массиве набора данных соответствует наблюдению, а каждый столбец - переменной. В этом смысле массив набора данных организует данные как типовую электронную таблицу.

Массивы набора данных являются уникальным типом данных с соответствующим набором допустимых операций. Даже если массив набора данных содержит только числовые переменные, вы не можете работать с массивом набора данных, как числовая переменная. Допустимые операции для массивов набора данных являются методами dataset класс.

Преобразование массива набора данных

Можно создать массив набора данных путем объединения переменных, существующих в рабочем пространстве MATLAB, или прямого импорта данных из файла, такого как текстовый файл или электронная таблица. В этой таблице представлены функции, которые можно использовать для создания массивов наборов данных.

Источник данныхПреобразование в массив набора данных
Данные из файлаdataset
Неоднородный набор переменных рабочей областиdataset
Числовой массивmat2dataset
Массив ячеекcell2dataset
Массив структурstruct2dataset
Таблицаtable2dataset

Можно экспортировать массивы наборов данных в текст или файлы электронной таблицы с помощью export. Чтобы преобразовать массив набора данных в массив ячеек или массив структур, используйте dataset2cell или dataset2struct. Чтобы преобразовать массив набора данных в таблицу, используйте dataset2table.

Свойства массива набора данных

В дополнение к хранению данных в массиве набора данных можно хранить такие метаданные, как:

  • Имена переменных и наблюдений

  • Описание данных

  • Единицы измерения

  • Описание переменных

Эта информация хранится в качестве свойств массива набора данных. Для массива набора данных с именем ds, можно просмотреть метаданные массива набора данных путем ввода ds.Properties в командной строке. Вы можете получить доступ к определенному свойству, такому как имена переменных - свойство VarNames- использование ds.Properties.VarNames. Вы можете как получить, так и изменить значения свойств с помощью этого синтаксиса.

Имена переменной и наблюдений включаются в отображение массива набора данных. Имена переменных отображаются в верхней строке, и имена наблюдений, если они присутствуют, появляются в первом столбце. Обратите внимание, что имена переменных и наблюдений не влияют на размер массива набора данных.

См. также

| | | | | | | |

Похожие темы