MATLAB® представляет данные, ориентированные на столбцы, с таблицами и расписаниями. Каждая переменная в таблице или расписании может иметь различные типы данных и любое количество столбцов. Векторы-столбцы являются наиболее распространенной формой переменных таблицы и расписания.
Формат файла Apache™ Parquet используется для гетерогенных данных, ориентированных на столбцы. Подобно таблицам MATLAB и расписаниям, каждый из столбцов в файле Parquet может иметь различные типы данных.
Несмотря на их сходство, разрешенные типы данных в таблицах MATLAB и расписаниях не всегда идеально соответствуют разрешенным типам данных в файлах Parquet. В некоторых случаях MATLAB необходимо выполнить преобразование типов данных, чтобы сохранить информацию в данных (например, отсутствующие значения). Это преобразование иногда может привести к потере точности в данных.
В целом, таблицы MATLAB и расписания имеют такое поведение, когда они преобразованы в файлы Parquet:
Свойства таблицы, установленные в исходной таблице, не сохраняются.
Имена строк таблицы или время строки расписания преобразуются в новую табличную переменную перед записью.
При чтении имени переменной из файла Parquet недопустимые имена табличных переменных преобразуются в допустимые имена табличных переменных.
В следующих таблицах суммируются представимые типы данных в таблицах MATLAB и расписаниях, а также то, как эти переменные представлены в файлах Parquet. Эти отображения типов данных могут идти в обоих направлениях (MATLAB → Parquet и Parquet → MATLAB), если не указано иное. Файлы Parquet используют небольшое количество примитивных (или физических) типов данных. Логические типы расширяют физические типы путем определения способа их интерпретации. Типы данных Parquet, не описанные здесь, не поддерживаются для чтения или записи в файлы Parquet (JSON, BSON, двоичный и так далее).
Таблица MATLAB или тип переменной Timetable | Тип данных Parquet Apache | Примечания | |
---|---|---|---|
Физический тип | Логический тип | ||
|
|
| MATLAB преобразует все отсутствующие числа с плавающей запятой в файле Parquet в |
|
|
| |
|
|
| При чтении файла Parquet, если массив с интегральным типом содержит отсутствующие значения, то массив преобразуется в MATLAB Для 64-битных целых чисел это преобразование может привести к усечению значений, которые больше по величине, чем |
|
| ||
|
| ||
|
| ||
|
| ||
|
| ||
|
|
| |
|
| ||
|
|
| При чтении файла Parquet, если массив с |
Таблица MATLAB или тип переменной Timetable | Тип данных Parquet Apache | Примечания | |
---|---|---|---|
Физический тип | Логический тип | ||
|
|
|
|
| |||
| |||
|
Таблица MATLAB или тип переменной Timetable | Тип данных Parquet Apache | Примечания | |
---|---|---|---|
Физический тип | Логический тип | ||
|
|
| MATLAB массивы datetime, записанные в файл Parquet, используют |
|
| ||
| |||
|
|
| Массивы длительности MATLAB, записанные в файл Parquet, используют |
|
|