parquetinfo

Получите информацию о файле Паркета

Описание

Объект ParquetInfo содержит информацию о файле Паркета, таком как размер файла, имена переменных, типы переменных и схемы сжатия. Чтобы получить информацию о файле Паркета, создайте объект ParquetInfo с помощью функции parquetinfo.

Создание

Синтаксис

info = parquetinfo(filename)

Описание

пример

info = parquetinfo(filename) возвращает объект info для файла Паркета, заданного filename.

Входные параметры

развернуть все

Имя файла Паркета, заданного как вектор символов или скаляр строки. ParquetInfo работает с Паркетом 1.0 или Паркетом 2,0 файла.

В зависимости от местоположения файла filename может взять одну из следующих форм.

Местоположение

Форма

Текущая папка или папка на пути MATLAB®

Задайте имя файла в filename.

Пример: 'data.parquet'

Файл в папке

Если файл не находится в текущей папке или в папке на пути MATLAB, то задайте полное имя или относительный путь.

Пример: 'C:\myFolder\data.parquet'

Пример: 'myDir\myFile.ext'

Удаленное местоположение

Если файл хранится в удаленном местоположении, то filename должен содержать полный путь файла, заданного как интернационализировавший идентификатор ресурса (IRI) формы:

scheme_name://path_to_file/my_file.ext

На основе вашего удаленного местоположения scheme_name может быть одним из значений в этой таблице.

Удаленное местоположениеscheme_name
Amazon S3™s3
Устройство хранения данных Windows Azure® Blobwasb, wasbs
HDFS™hdfs

Для получения дополнительной информации смотрите работу с Удаленными данными.

Пример: 's3://bucketname/path_to_file/data.parquet'

Типы данных: char | string

Свойства

развернуть все

Это свойство доступно только для чтения.

Абсолютный путь, чтобы Устелить паркетом файл, заданный как скаляр строки.

Типы данных: string

Это свойство доступно только для чтения.

Размер файла в байтах, заданных как double.

Типы данных: double

Это свойство доступно только для чтения.

Количество групп строки, заданных как double.

Типы данных: double

Это свойство доступно только для чтения.

Количество строк в каждой группе строки, заданной как double.

Типы данных: double

Это свойство доступно только для чтения.

Имена переменных, заданные как массив строк. Если файл Паркета содержит переменные N, то VariableNames является массивом размера 1-by-N содержащий имена переменных.

Типы данных: string

Это свойство доступно только для чтения.

Типы данных переменных, заданные как массив строк. Если файл Паркета содержит переменные N, то VariableTypes является массивом размера 1-by-N содержащий имена типов данных для каждой переменной.

Каждый элемент в массиве является именем типа данных MATLAB к который соответствующая переменная в картах файлов Паркета.

Типы данных: string

Это свойство доступно только для чтения.

Переменный алгоритм сжатия, заданный как массив строк. Если файл Паркета содержит переменные N, то VariableCompression является массивом размера 1-by-N содержащий имена алгоритма сжатия.

Каждый элемент в массиве соответствует алгоритму сжатия, используемому, чтобы сжать ту переменную в файле Паркета.

Примеры

свернуть все

Используйте функцию praquetinfo, чтобы создать объект ParquetInfo, содержащий информацию о файле.

info = parquetinfo('outages.parquet')
info = 
  ParquetInfo with properties:

               Filename: "/mathworks/devel/bat/BR2019ad/build/matlab/toolbox/matlab/demos/outages.parquet"
               FileSize: 44202
           NumRowGroups: 1
        RowGroupHeights: 1468
          VariableNames: [1x6 string]
          VariableTypes: [1x6 string]
    VariableCompression: [1x6 string]

Отобразите имя, введите, и схема сжатия для третьей переменной в файле.

disp([info.VariableNames(3)  info.VariableTypes(3) info.VariableCompression(3)]) 
    "Loss"    "double"    "snappy"

Смотрите также

| |

Введенный в R2019a