Тип данных dataset
может быть удален в будущем релизе. Чтобы работать с гетерогенными данными, используйте тип данных MATLAB® table
вместо этого. Смотрите MATLAB документация table
для получения дополнительной информации.
Statistics and Machine Learning Toolbox™ имеет dataset arrays для хранения переменных с типами гетерогенных данных. Например, можно объединить числовые данные, логические данные, массивы ячеек из символьных векторов и категориальные массивы в одной переменной типа массив набора данных.
В массиве набора данных каждая переменная (столбец) должна быть одним типом гомогенных данных, но различные переменные могут иметь типы гетерогенных данных. Массив набора данных обычно интерпретируется как набор переменных, измеренных на многих модулях наблюдения. Таким образом, каждая строка в массиве набора данных соответствует наблюдению и каждому столбцу к переменной. В этом смысле массив набора данных организует данные как типичная электронная таблица.
Массивы набора данных являются уникальным типом данных с соответствующим набором допустимых операций. Даже если массив набора данных содержит только числовые переменные, вы не можете работать с массивом набора данных как числовая переменная. Допустимые операции для массивов набора данных являются методами класса dataset
.
Можно создать массив набора данных путем объединения переменных, которые существуют в рабочем пространстве MATLAB или непосредственно импортировании данных из файла, такого как текстовый файл или электронная таблица. Эта таблица суммирует функции, которые можно использовать, чтобы создать массивы набора данных.
Источник данных | Преобразование в массив набора данных |
---|---|
Данные из файла | dataset |
Неоднородный набор переменных рабочей области | dataset |
Числовой массив | mat2dataset |
CellArray | cell2dataset |
Массив структур | struct2dataset |
Таблица | table2dataset |
Можно экспортировать массивы набора данных в текст или файлы электронной таблицы с помощью export
. Чтобы преобразовать массив набора данных в массив ячеек или массив структур, используйте dataset2cell
или dataset2struct
. Чтобы преобразовать массив набора данных в таблицу, используйте dataset2table
.
В дополнение к тому, чтобы хранить данные в массиве набора данных можно сохранить метаданные, такие как:
Переменная и имена наблюдения
Описания данных
Модули измерения
VariableDescriptions
Эта информация хранится как свойства массива набора данных. Для массива набора данных под названием ds
можно просмотреть метаданные набора данных массивов путем ввода ds.Properties
в командной строке. Можно получить доступ к определенному свойству, такому как имена переменных — свойству VarNames
— использование ds.Properties.VarNames
. Можно и получить и изменить значения свойств с помощью этого синтаксиса.
Переменная и имена наблюдения включены в отображение массива набора данных. Отображение имен переменных через верхнюю строку и имена наблюдения, если есть появляются в первом столбце. Обратите внимание на то, что переменная и имена наблюдения не влияют на размер массива набора данных.
cell2dataset
| dataset
| dataset2cell
| dataset2struct
| dataset2table
| export
| mat2dataset
| struct2dataset
| table2dataset