MATLAB ® представляет данные, ориентированные на столбцы, с таблицами и расписаниями. Каждая переменная в таблице или расписании может иметь различный тип данных и любое количество столбцов. Векторы столбцов являются наиболее распространенной формой переменных таблицы и расписания.
Формат файла Паркета Apache™ используется для ориентированных на колонку разнородных данных. Подобно таблицам и расписаниям MATLAB, каждый из столбцов в файле Parquet может иметь различные типы данных.
Несмотря на их сходство, разрешенные типы данных в таблицах и расписаниях MATLAB не всегда полностью соответствуют разрешенным типам данных в файлах Parquet. В некоторых случаях MATLAB необходимо выполнить преобразования типов данных для сохранения информации в данных (например, отсутствующих значений). Такое преобразование иногда может привести к потере точности данных.
Как правило, таблицы и расписания MATLAB имеют следующие варианты поведения при преобразовании в файлы Parquet:
Свойства таблицы, заданные в исходной таблице, не сохраняются.
Имена строк таблицы или время строк расписания преобразуются в новую переменную таблицы перед записью.
При чтении имени переменной из файла Parquet недопустимые имена табличных переменных преобразуются в допустимые имена табличных переменных.
В следующих таблицах приведены сводные данные о представимых типах данных в таблицах и расписаниях MATLAB, а также о том, как эти переменные представлены в файлах Parquet. Эти сопоставления типов данных могут выполняться в обоих направлениях (MATLAB → Parquet and Parquet → MATLAB), если не указано иное. Файлы паркета используют небольшое количество примитивных (или физических) типов данных. Логические типы расширяют физические типы, указывая способ их интерпретации. Типы данных паркета, не охваченные здесь, не поддерживаются для чтения или записи в файлы паркета (JSON, BSON, двоичные файлы и т. д.).
| Таблица MATLAB или тип переменной расписания | Тип данных Apache Parquet | Примечания | |
|---|---|---|---|
Физический тип | Логический тип | ||
|
|
| MATLAB преобразует любые отсутствующие числа с плавающей запятой в файле паркета в |
|
|
| |
|
|
| При чтении файла Parquet, если массив с интегральным типом содержит отсутствующие значения, массив преобразуется в MATLAB Для 64-разрядных целых чисел это преобразование может привести к усечению значений, которые больше по величине, чем |
|
| ||
|
| ||
|
| ||
|
| ||
|
| ||
|
|
| |
|
| ||
|
|
| При чтении файла Parquet, если массив с |
| Таблица MATLAB или тип переменной расписания | Тип данных Apache Parquet | Примечания | |
|---|---|---|---|
Физический тип | Логический тип | ||
|
|
|
|
| |||
| |||
| |||
| Таблица MATLAB или тип переменной расписания | Тип данных Apache Parquet | Примечания | |
|---|---|---|---|
Физический тип | Логический тип | ||
|
|
| Массивы datetime MATLAB, записанные в паркетный файл |
|
| ||
| |||
|
|
| Массивы длительности MATLAB, записанные в паркетный файл |
|
| ||