Определение настроек импорта для таблиц

Как правило, вы можете таблицы импорта с помощью readtable функция. Однако иногда импортирование табличных данных требует дополнительного управления процессом импорта. Например, вы можете хотеть выбрать переменные, чтобы импортировать или обработать строки с отсутствующими или ошибочными данными. Чтобы управлять процессом импорта, можно создать объект настроек импорта. Объект имеет свойства, которые можно настроить на основе потребностей импорта.

Создание настроек импорта

Чтобы создать, настройки импорта возражают для набора выборочных данных, airlinesmall.csv, используйте detectImportOptions функция. detectImportOptions функция создает DelimitedTextImportOptions объект для этого текстового файла. Для полного списка свойств объекта настроек импорта смотрите detectImportOptions страница с описанием.

opts = detectImportOptions('airlinesmall.csv');

Настройка настроек импорта табличного уровня

Объект настроек импорта имеет свойства, которые можно настроить, чтобы управлять процессом импорта. Некоторые свойства применяются к целой таблице, в то время как другие обращаются к определенным переменным. Свойства, которые влияют на целую таблицу, включают правила справиться с порождением ошибки или недостающими данными. Например, удалите строки с данными, которые вызывают ошибки импорта путем установки ImportErrorRule к 'omitrow'. Замените отсутствующие значения путем установки MissingRule к 'fill'. FillValue значение свойства определяет, какое значение заменяет отсутствующие значения. Например, можно заменить отсутствующие значения на NaN.

opts.ImportErrorRule = 'omitrow';
opts.MissingRule = 'fill';

Настройка настроек импорта Переменного Уровня

Чтобы добраться и установить опции для определенных переменных используют getvaroptssetvartype, и setvaropts функции. Например, просмотрите текущие опции для переменных под названием FlightNum, Origin, Dest, и ArrDelay, использование getvaropts функция.

getvaropts(opts,{'FlightNum','Origin','Dest','ArrDelay'});

Измените типы данных для переменных с помощью setvartype функция:

  • Начиная со значений в переменной FlightNum идентификаторы для рейса и не численных значений, изменяют его тип данных в char.

  • Начиная с переменных Origin и Dest определяйте конечное множество повторяющихся текстовых значений, измените их тип данных в categorical.

 opts = setvartype(opts,{'FlightNum','Origin','Dest','ArrDelay'},...
                        {'char','categorical','categorical','single'});

Измените другие свойства с помощью setvaropts функция:

  • Для FlightNum переменная, удалите любые ведущие пробелы из текста путем установки WhiteSpaceRule свойство к trimleading.

  • Для ArrDelay переменная, поля замены, содержащие 0 или NA со значением, заданным в FillValue свойство путем установки TreatAsMissing свойство.

 opts = setvaropts(opts,'FlightNum','WhitespaceRule','trimleading');
 opts = setvaropts(opts,'ArrDelay','TreatAsMissing',{'0','NA'});

Таблица импорта

Задайте переменные, чтобы получить, импортировать их использующий readtable, и отобразите первый 8 строки таблицы.

opts.SelectedVariableNames = {'FlightNum','Origin','Dest','ArrDelay'}; 
T = readtable('airlinesmall.csv',opts);
T(1:8,:)
ans=8×4 table
    FlightNum    Origin    Dest    ArrDelay
    _________    ______    ____    ________

    {'1503'}      LAX      SJC         8   
    {'1550'}      SJC      BUR         8   
    {'1589'}      SAN      SMF        21   
    {'1655'}      BUR      SJC        13   
    {'1702'}      SMF      LAX         4   
    {'1729'}      LAX      SJC        59   
    {'1763'}      SAN      SFO         3   
    {'1800'}      SEA      LAX        11   

Смотрите также

| | | | | | | | |

Похожие темы