MATLAB® представляет данные в столбцах таблицами и расписаниями. Каждая переменная в таблице или расписании может иметь другой тип данных и любое количество столбцов. Вектор-столбцы являются наиболее распространенной формой переменных таблицы и расписания.
Формат файла Parquet Apache™ используется для ориентированных на столбец гетерогенных данных. Подобно таблицам MATLAB и расписаниям, каждый из столбцов в файле Parquet может иметь различные типы данных.
Несмотря на их подобие, разрешенные типы данных в таблицах MATLAB и расписаниях не всегда сопоставляют отлично с разрешенными типами данных в файлах Parquet. В некоторых случаях необходимо для MATLAB выполнить преобразования типа данных, чтобы сохранить информацию в данных (таких как отсутствующие значения). Это преобразование может иногда приводить к потере точности в данных.
В общем случае таблицы MATLAB и расписания имеют эти поведения, когда они преобразованы в файлы Parquet:
Набор свойств таблицы на исходной таблице не сохранен.
Имена строки таблицы или времена строки расписания преобразованы в новую табличную переменную прежде чем быть записанным.
При чтении имени переменной из файла Parquet недопустимые имена табличной переменной преобразованы в допустимые имена табличной переменной.
Следующие таблицы обобщают представимые типы данных в таблицах MATLAB и расписаниях, а также как те переменные представлены в файлах Parquet. Эти отображения типа данных могут войти в оба направления (MATLAB → Паркет и Паркет → MATLAB), если не указано иное. Файлы Parquet используют небольшое количество примитивного (или физический) типы данных. Логические типы расширяют физические типы путем определения, как они должны быть интерпретированы. Устелите паркетом типы данных, не покрытые, здесь не поддерживаются для чтения от или записи в файлы Parquet (JSON, BSON, двоичный файл, и так далее).
Таблица MATLAB или тип переменной расписания | Тип данных паркета Apache | Примечания | |
---|---|---|---|
Физический тип | Логический тип | ||
|
|
| MATLAB преобразует любые недостающие числа с плавающей запятой в файле Parquet в |
|
|
| |
|
|
| При чтении файла Parquet, если массив с целочисленным типом содержит отсутствующие значения, то массив преобразован в Для 64-битных целых чисел это преобразование может привести к усечению значений, которые больше в величине, чем |
|
| ||
|
| ||
|
| ||
|
| ||
|
| ||
|
|
| |
|
| ||
|
|
| При чтении файла Parquet, если массив с |
Таблица MATLAB или тип переменной расписания | Тип данных паркета Apache | Примечания | |
---|---|---|---|
Физический тип | Логический тип | ||
|
|
| Категориальные массивы преобразованы в строковые массивы, когда записано в файлы Parquet. Любой |
|
| ||
| |||
|
Таблица MATLAB или тип переменной расписания | Тип данных паркета Apache | Примечания | |
---|---|---|---|
Физический тип | Логический тип | ||
|
|
| Массивы datetime MATLAB, записанные в файл Parquet, используют |
|
| ||
| |||
|
|
| Массивы длительности MATLAB, записанные в файл Parquet, используют |
|
|