Примечание
dataset
тип данных не рекомендуется. Чтобы работать с гетерогенными данными, используйте MATLAB®
table
тип данных вместо этого. Смотрите MATLAB table
документация для получения дополнительной информации.
Statistics and Machine Learning Toolbox™ имеет dataset arrays для хранения переменных с типами гетерогенных данных. Например, можно объединить числовые данные, логические данные, массивы ячеек из символьных векторов и категориальные массивы в одной переменной типа массив набора данных.
В массиве набора данных каждая переменная (столбец) должна быть одним типом гомогенных данных, но различные переменные могут иметь типы гетерогенных данных. Массив набора данных обычно интерпретируется в виде набора переменных, измеренных на многих модулях наблюдения. Таким образом, каждая строка в массиве набора данных соответствует наблюдению и каждому столбцу к переменной. В этом смысле массив набора данных организует данные как типичная электронная таблица.
Массивы набора данных являются уникальным типом данных с соответствующим набором допустимых операций. Даже если массив набора данных содержит только числовые переменные, вы не можете работать с массивом набора данных как числовая переменная. Допустимые операции для массивов набора данных являются методами dataset
класс.
Можно создать массив набора данных путем объединения переменных, которые существуют в рабочем пространстве MATLAB или непосредственно импортировании данных из файла, такого как текстовый файл или электронная таблица. Эта таблица суммирует функции, которые можно использовать, чтобы создать массивы набора данных.
Источник данных | Преобразование в массив набора данных |
---|---|
Данные из файла | dataset |
Неоднородный набор переменных рабочей области | dataset |
Числовой массив | mat2dataset |
CellArray | cell2dataset |
Массив структур | struct2dataset |
Таблица | table2dataset |
Можно экспортировать массивы набора данных в текст или файлы электронной таблицы с помощью export
. Чтобы преобразовать массив набора данных в массив ячеек или массив структур, используйте dataset2cell
или dataset2struct
. Чтобы преобразовать массив набора данных в таблицу, использовать dataset2table
.
В дополнение к тому, чтобы хранить данные в массиве набора данных можно сохранить метаданные, такие как:
Переменная и имена наблюдения
Описания данных
Единицы измерения
VariableDescriptions
Эта информация хранится как свойства массива набора данных. Для массива набора данных под названием ds
, можно просмотреть метаданные набора данных массивов путем ввода ds.Properties
в командной строке. Можно получить доступ к определенному свойству, такому как имена переменных — свойство VarNames
— использование ds.Properties.VarNames
. Можно и получить и изменить значения свойств с помощью этого синтаксиса.
Переменная и имена наблюдения включены в отображение массива набора данных. Отображение имен переменных через верхнюю строку и имена наблюдения, если есть появляются в первом столбце. Обратите внимание на то, что переменная и имена наблюдения не влияют на размер массива набора данных.
cell2dataset
| dataset
| dataset2cell
| dataset2struct
| dataset2table
| export
| mat2dataset
| struct2dataset
| table2dataset