Примечание
The dataset
тип данных не рекомендуется. Для работы с неоднородными данными используйте MATLAB®
table
вместо этого тип данных. См. MATLAB table
документация для получения дополнительной информации.
Statistics and Machine Learning Toolbox™ имеет dataset arrays для хранения переменных с неоднородными типами данных. Например, можно объединить числовые данные, логические данные, массивы ячеек векторов символов и категориальные массивы в одну переменную массива набора данных.
В массиве набора данных каждая переменная (столбец) должна быть одним однородным типом данных, но различные переменные могут быть гетерогенными типами данных. Массив набора данных обычно интерпретируется как набор переменных, измеренных на многих модулях наблюдения. То есть каждая строка в массиве набора данных соответствует наблюдению, а каждый столбец - переменной. В этом смысле массив набора данных организует данные как типовую электронную таблицу.
Массивы набора данных являются уникальным типом данных с соответствующим набором допустимых операций. Даже если массив набора данных содержит только числовые переменные, вы не можете работать с массивом набора данных, как числовая переменная. Допустимые операции для массивов набора данных являются методами dataset
класс.
Можно создать массив набора данных путем объединения переменных, существующих в рабочем пространстве MATLAB, или прямого импорта данных из файла, такого как текстовый файл или электронная таблица. В этой таблице представлены функции, которые можно использовать для создания массивов наборов данных.
Источник данных | Преобразование в массив набора данных |
---|---|
Данные из файла | dataset |
Неоднородный набор переменных рабочей области | dataset |
Числовой массив | mat2dataset |
Массив ячеек | cell2dataset |
Массив структур | struct2dataset |
Таблица | table2dataset |
Можно экспортировать массивы наборов данных в текст или файлы электронной таблицы с помощью export
. Чтобы преобразовать массив набора данных в массив ячеек или массив структур, используйте dataset2cell
или dataset2struct
. Чтобы преобразовать массив набора данных в таблицу, используйте dataset2table
.
В дополнение к хранению данных в массиве набора данных можно хранить такие метаданные, как:
Имена переменных и наблюдений
Описание данных
Единицы измерения
Описание переменных
Эта информация хранится в качестве свойств массива набора данных. Для массива набора данных с именем ds
, можно просмотреть метаданные массива набора данных путем ввода ds.Properties
в командной строке. Вы можете получить доступ к определенному свойству, такому как имена переменных - свойство VarNames
- использование ds.Properties.VarNames
. Вы можете как получить, так и изменить значения свойств с помощью этого синтаксиса.
Имена переменной и наблюдений включаются в отображение массива набора данных. Имена переменных отображаются в верхней строке, и имена наблюдений, если они присутствуют, появляются в первом столбце. Обратите внимание, что имена переменных и наблюдений не влияют на размер массива набора данных.
cell2dataset
| dataset
| dataset2cell
| dataset2struct
| dataset2table
| export
| mat2dataset
| struct2dataset
| table2dataset