tabularTextDatastore

Datastore для табличных текстовых файлов

Описание

Используйте TabularTextDatastore объект управлять большим количеством текстовых файлов, содержащих ориентированный на столбец или табличные данные, где набор не обязательно умещается в памяти. Табличные данные являются данными, которые располагаются прямоугольным способом с каждой строкой, имеющей то же количество записей. Можно создать TabularTextDatastore объект с помощью tabularTextDatastore функционируйте, задайте его свойства, и затем импортируйте и обработайте функции объекта использования данных.

Создание

Описание

пример

ttds = tabularTextDatastore(location) создает datastore из набора данных, заданных location.

ttds = tabularTextDatastore(location,Name,Value) задает дополнительные параметры и свойства для ttds использование одного или нескольких аргументов пары "имя-значение". Например, tabularTextDatastore(location,'FileExtensions',{'.txt','.csv'}) создает datastore только из файлов в location с расширениями .txt и .csv.

Входные параметры

развернуть все

Файлы или папки, включенные в datastore, заданный как путь или DsFileSet объект.

  • path Задайте путь как вектор символов, массив ячеек из символьных векторов, представьте в виде строки скаляр или массив строк, содержа местоположение файлов или папок, которые являются локальными или удаленными.

    • Локальные файлы или папки — Задают location как локальный путь к файлам или папкам. Если файлы не находятся в текущей папке, то локальный путь должен задать полные или относительные пути. Файлы в подпапках заданной папки автоматически не включены в datastore. Можно использовать подстановочный символ (*) при определении локального пути. Этот символ указывает, что datastore включает все файлы соответствия или все файлы в соответствующих папках.

    • Удаленные файлы или папки — Задают location быть полными путями файлов или папок как универсальный локатор ресурса (URL) формы hdfs:///path_to_file. Для получения дополнительной информации смотрите работу с Удаленными данными.

  • DsFileSet объект — также можно задать location как DsFileSet объект. Для получения дополнительной информации смотрите matlab.io.datastore.DsFileSet.

Когда location представляет папку, datastore включает только поддерживаемые форматы файлов и игнорирует любой другой формат. Чтобы задать пользовательский список расширений файла, чтобы включать в ваш datastore, смотрите FileExtensions свойство.

tabularTextDatastore функция поддерживает эти расширения: .txt, .csv, .dat, .dlm, .ascТекст, или никакое расширение.

Пример: 'file1.csv'

Пример: '../dir/data/file1'

Пример: {'C:\dir\data\file1.csv','C:\dir\data\file2.dat'}

Пример: 'C:\dir\data\*.text'

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: ttds = tabularTextDatastore('C:\dir\textdata','FileExtensions',{'.csv','.txt'})

Флаг включения подпапки, заданный как разделенная запятой пара, состоящая из 'IncludeSubfolders' и trueложь, 0, или 1. Задайте true включать все файлы и подпапки в каждой папке или false включать только файлы в каждой папке.

Когда вы не задаете 'IncludeSubfolders', затем значением по умолчанию является false.

Пример: 'IncludeSubfolders',true

Типы данных: логический | double

Расширения текстового файла, заданные как разделенная запятой пара, состоящая из 'FileExtensions' и вектор символов, массив ячеек из символьных векторов, представляет в виде строки скаляр или массив строк. Заданные расширения не требуют поддерживаемого формата. Если вы хотите включать неподдерживаемые расширения, то задайте все расширения. Используйте пустые кавычки '' представлять файлы без расширений.

Пример: 'FileExtensions','.txt'

Пример: 'FileExtensions',{'.text','.csv'}

Типы данных: char | cell | string

Альтернативные пути к корню файловой системы, заданные как разделенная запятой пара, состоящая из 'AlternateFileSystemRoots' и вектор строки или массив ячеек. Используйте 'AlternateFileSystemRoots' когда вы создаете datastore на локальной машине, но должны получить доступ и обработать данные на другой машине (возможно различной операционной системы). Кроме того, когда обработка данных с помощью Parallel Computing Toolbox™ и MATLAB® Parallel Server™ и данных хранится на локальных машинах с копией доступных данных на облаке другой платформы или кластерных машинах, необходимо использовать 'AlternateFileSystemRoots' сопоставлять корневые пути.

  • Чтобы сопоставить набор корневых путей, которые эквивалентны друг другу, задайте 'AlternateFileSystemRoots' как вектор строки. Например,

    ["Z:\datasets","/mynetwork/datasets"]

  • Чтобы сопоставить несколько наборов корневых путей, которые эквивалентны для datastore, задайте 'AlternateFileSystemRoots' как массив ячеек, содержащий несколько строк, где каждая строка представляет набор эквивалентных корневых путей. Задайте каждую строку в массиве ячеек или как вектор строки или как массив ячеек из символьных векторов. Например:

    • Задайте 'AlternateFileSystemRoots' как массив ячеек векторов строки.

      {["Z:\datasets", "/mynetwork/datasets"];...
       ["Y:\datasets", "/mynetwork2/datasets","S:\datasets"]}

    • В качестве альтернативы задайте 'AlternateFileSystemRoots' как массив ячеек массива ячеек из символьных векторов.

      {{'Z:\datasets','/mynetwork/datasets'};...
       {'Y:\datasets', '/mynetwork2/datasets','S:\datasets'}}

Значение 'AlternateFileSystemRoots' должен удовлетворить этим условиям:

  • Содержит одну или несколько строк, где каждая строка задает набор эквивалентных корневых путей.

  • Каждая строка задает несколько корневых путей, и каждый корневой путь должен содержать по крайней мере два символа.

  • Корневые пути уникальны и не являются подпапками друг друга.

  • Содержит по крайней мере одну корневую запись пути, которая указывает на местоположение файлов.

Для получения дополнительной информации смотрите Настроенный Datastore для Обработки на Различных Машинах или Кластерах.

Пример: ["Z:\datasets","/mynetwork/datasets"]

Типы данных: string | cell

Тип выходных данных текстовых переменных, заданных как разделенная запятой пара, состоящая из 'TextType' и любой 'char' или 'string'. Если выходная таблица от readreadall, или preview функции содержат текстовые переменные, затем 'TextType' задает тип данных тех переменных для TabularTextDatastore. Если 'TextType' ischar, затем выход является массивом ячеек из символьных векторов. Если 'TextType' isstring, затем выход имеет, вводят string.

Типы данных: char | string

Введите для импортированных данных о дате и времени, заданных как разделенная запятой пара, состоящая из 'DatetimeType' и одно из этих значений: 'datetime' или 'text'.

ЗначениеВведите для импортированных данных о дате и времени
'datetime'

MATLAB datetime тип данных

Для получения дополнительной информации смотрите datetime.

'text'

Если 'DatetimeType' задан как 'text', затем тип для импортированных данных о дате и времени зависит от значения, заданного в 'TextType' свойство:

  • Если 'TextType' ischar, затем tabularTextdatastore даты импорта как массив ячеек из символьных векторов.

  • Если 'TextType' isstring, затем tabularTextdatastore даты импорта как массив строк.

Если заданный TextscanFormats свойство содержит %D, затем tabularTextdatastore игнорирует значение, заданное в DatetimeType.

Пример: 'DatetimeType','datetime'

Типы данных: char | string

Тип выходных данных данных о длительности, заданных как разделенная запятой пара, состоящая из 'DurationType' и любой 'duration' или 'text'.

ЗначениеВведите для импортированных данных о длительности
'duration'

MATLAB duration тип данных

Для получения дополнительной информации смотрите duration.

'text'

Если 'DurationType' задан как 'text', затем тип для импортированных данных о длительности зависит от значения, заданного в 'TextType' параметр:

  • Если 'TextType' ischar, затем функция импорта возвращает данные о длительности как массив ячеек из символьных векторов.

  • Если 'TextType' isstring, затем функция импорта возвращает данные о длительности как массив строк.

Типы данных: char | string

Локаль, чтобы интерпретировать даты, заданные как вектор символов или представить скаляр в виде строки. DatetimeLocale значение определяет, как функция импорта интерпретирует текст, который представляет даты и времена.

При определении DatetimeLocale, используйте форму xx_YY, где xx строчный ISO 639-1 двухбуквенный код, который задает язык и YY прописная альфа ISO 3166-1 2 кода, которые задают страну.

Эта таблица приводит некоторые общие ценности для локали.

Локаль ЯзыкСтрана
'de_DE'Немецкий языкГермания
'en_GB'Английский языкСоединенное Королевство
'en_US'Английский языкСоединенные Штаты
'es_ES'Испанский языкИспания
'fr_FR'Французский языкФранция
'it_IT'Итальянский языкИталия
'ja_JP'Японский языкЯпония
'ko_KR'Корейский языкКорея
'nl_NL'Нидерландский языкНидерланды
'zh_CN'Китайский язык (упрощен)Китай

Примечание

Locale значение определяет, как интерпретированы входные значения. Формат отображения и язык заданы опцией Локали в разделе формата Datetime панели Настроек. Чтобы изменить локаль datetime по умолчанию, см. Настройку параметров командного окна.

Типы данных: char | string

В дополнение к этим парам "имя-значение" также можно задать свойства на этой странице как пары "имя-значение", за исключением Files свойство.

Свойства

развернуть все

TabularTextDatastore свойства описывают файлы, сопоставленные с TabularTextDatastore объект. А именно, свойства описывают формат данных в файлах и управляют, как данные должны быть считаны из datastore. Когда вы создаете TabularTextDatastore объект, функция datastore использует первый файл в Files свойство определить значения свойств. За исключением Files свойство, можно задать значение TabularTextDatastore аргументы пары "имя-значение" использования свойств, когда вы создаете объект datastore. Чтобы просмотреть или изменить свойство после создания объекта, используйте запись через точку:

ds = datastore('airlinesmall.csv');
ds.TreatAsMissing = 'NA';
ds.MissingValue = 0;

File Properties

Файлы включали в datastore, разрешенный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка являются полным путем к файлу. location аргумент в tabularTextDatastore и datastore функции задают эти файлы.

Первый файл задан Files свойство определяет имена переменных и данные о формате для всех файлов в datastore.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Пример: {'C:\dir\data\mydata1.csv';'C:\dir\data\mydata2.csv'}

Типы данных: cell | string

Кодирование файла, заданное как вектор символов или скаляр строки как одно из этих значений.

'IBM866'

'ISO-8859-1'

'windows-847'

'KOI8-R'

'ISO-8859-2'

'windows-1250'

'KOI8-U'

'ISO-8859-3'

'windows-1251'

'Macintosh'

'ISO-8859-4'

'windows-1252'

'US-ASCII'

'ISO-8859-5'

'windows-1253'

'UTF-8'

'ISO-8859-6'

'windows-1254'

 

'ISO-8859-7'

'windows-1255'

 

'ISO-8859-8'

'windows-1256'

 

'ISO-8859-9'

'windows-1257'

 

'ISO-8859-11'

'windows-1258'

 

'ISO-8859-13'

 
 

'ISO-8859-15'

 

Если каждый файл в datastore помещается в память, то FileEncoding также может быть одно из этих значений.

'Big5'

'EUC-KR'

'GB18030'

'Shift_JIS'

'Big5-HKSCS'

'EUC-JP'

'GB2312'

'windows-949'

'CP949'

'EUC-TW'

'GBK'

 

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Типы данных: char | string

Считайте имена переменных, заданные как логический true или false.

  • Если незаданный, tabularTextDatastore функция обнаруживает присутствие имен переменных автоматически.

  • Если true, затем первая строка незаголовка первого файла определяет имена переменных для данных.

  • Если false, затем первая строка незаголовка первого файла содержит первую строку данных. Данные присвоены имена переменных по умолчанию, Var1, Var2, и так далее.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Типы данных: логический

Отметьте, чтобы сохранить имена переменных, заданные как разделенная запятой пара, состоящая из PreserveVariableNames и любой true, или false.

  • true — Сохраните имена переменных, которые не являются допустимыми идентификаторами MATLAB, такими как имена переменных, которые включают символы non-ASCII и пробелы.

  • false — Преобразуйте недопустимые имена переменных (как определено isvarname функция) к допустимым идентификаторам MATLAB.

Начиная в R2019b, имена переменных и имена строки могут включать любые символы, включая символы non-ASCII и пробелы. Кроме того, они могут запустить с любых символов, не только обозначает буквами. Переменная и имена строки не должны быть допустимыми идентификаторами MATLAB (как определено isvarname функция. Чтобы сохранить эти имена переменных и имена строки, установите PreserveVariableNames к true.

Имена переменных в datastore, заданном как массив ячеек из символьных векторов или массив строк. Задайте имена переменных в порядке, в котором они появляются в файлах. Если вы не задаете имена переменных, они обнаруживаются от первой линии незаголовка в первом файле datastore. При изменении VariableNames свойство, количество новых имен переменных должно совпадать с количеством исходных имен переменных.

Чтобы поддержать недопустимые идентификаторы MATLAB как, имена переменных, такие как имена varible, содержащие пробелы и символы non-ASCII, устанавливают PreserveVariableNames параметр к true.

Если ReadVariableNames false, затем VariableNames значения по умолчанию к {'Var1','Var2', ...}.

Пример: {'Time','Name','Quantity'}

Типы данных: cell | string

Text Format Properties

Количество линий, чтобы пропустить в начале файла, заданного как неотрицательное целое число. Если незаданный, tabularTextDatastore функция обнаруживает количество линий, чтобы пропустить автоматически.

tabularTextDatastore функция игнорирует конкретное количество линий заголовка прежде, чем считать имена переменных или данные.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Типы данных: double

Символы разделителя полей, заданные как вектор символов, массив ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Задайте несколько разделителей в массиве ячеек из символьных векторов или массиве строк. Если незаданный, tabularTextDatastore функция обнаруживает разделитель автоматически.

Пример: '|'

Пример: {';','*'}

Повторные символы-разделители в файле интерпретированы, как разделяют разделители пустыми полями между ними. Если незаданный, функция чтения обнаруживает разделитель автоматически по умолчанию.

Когда вы задаете одну из следующих escape-последовательностей как разделитель, она преобразована в соответствующий управляющий символ.

\bКлавиша Backspace
\nНовая строка
\rВозврат каретки
\tВкладка
\\Обратная косая черта (\)

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Типы данных: char | cell | string

Символ-разделитель строки, заданный как вектор символов или скаляр строки, который должен быть или отдельным символом или одним из '\r'N, или '\r\n'.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Пример: ':'

Типы данных: char | string

Числовые значения, чтобы обработать как отсутствующие значения, заданные как односимвольный вектор, массив ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Значения, заданные как TreatAsMissing подставлены со значением, заданным в MissingValue свойство. Например, если MissingValue задан, чтобы быть NaN, и TreatAsMissing задан как 'NA'. Затем в импортированных данных, всех случаях 'NA' заменяются NaN.

Эта опция только применяется к числовым полям. Кроме того, это свойство эквивалентно TreatAsEmpty аргумент пары "имя-значение" для textscan функция.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Пример: 'NA'

Пример: '-99'

Пример: {'-',''}

Типы данных: char | cell | string

Значение для пропавших без вести числовых полей в файлах разделенного текста, заданных как скаляр. Это свойство эквивалентно EmptyValue аргумент пары "имя-значение" для textscan функция.

Типы данных: double

Расширенные свойства текстового формата

Формат поля данных, заданный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат один спецификатор преобразования.

Когда вы задаете или изменяете TextscanFormats свойство, можно использовать те же спецификаторы преобразования что textscan функция принимает для formatSpec аргумент. Допустимые значения для TextscanFormats включайте спецификаторы преобразования что поля игнорируемых данных с помощью звездочки (*) символ и единицы тот буквенный текст пропуска. Количество спецификаторов преобразования должно совпадать с количеством переменных в VariableNames свойство.

  • Если значение TextscanFormats включает спецификаторы преобразования что поля игнорируемых данных с помощью символов звездочки (*), затем значение SelectedVariableNames свойство автоматически обновляется. MATLAB использует %*q спецификатор преобразования к полям игнорируемых данных не использован SelectedVariableNames свойство и обработки полевое содержимое как векторы буквенного символа. Для файлов с фиксированной шириной укажите на пропущенное поле с помощью соответствующего спецификатора преобразования наряду с шириной поля. Например, %*52c пропускает поле, которое содержит 52 символа.

  • Если вы не задаете значение для TextscanFormats, затем datastore определяет формат полей данных путем сканирования текста от первой линии незаголовка в первом файле datastore.

Пример: {'%s','%s','%f'}

Типы данных: cell | string

Символы экспоненты, заданные как вектор символов или скаляр строки. Символами экспоненты по умолчанию является eED, и D.

Типы данных: char | string

Стиль комментариев в файле, заданном как вектор символов, массив ячеек из символьных векторов, представляет в виде строки скаляр или массив строк.

Например, задайте '%' проигнорировать символы после текста на той же линии. Задайте {'/*','*/'} проигнорировать символы между текстом.

При чтении из TabularTextDatastore, read функционируйте проверки на комментарии только в начале каждого поля, не в поле.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Пример: 'CommentStyle',{'/*', '*/'}

Типы данных: char | cell | string

Пробельные символы, заданные как вектор символов или скаляр строки одного или нескольких символов.

Когда вы задаете одну из следующих escape-последовательностей как любой пробельный символ, datastore функция преобразует ту последовательность в соответствующий управляющий символ.

\bКлавиша Backspace
\nНовая строка
\rВозврат каретки
\tВкладка
\\Обратная косая черта (\)

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Пример: ' \b\t'

Типы данных: char | string

Несколько обработка разделителя, заданная как любой true или false. Если true, затем datastore обрабатывает последовательные разделители как один разделитель. Повторные разделители, разделенные пробелом, также обработаны как один разделитель.

Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore свойства.

Свойства, которые управляют таблицей, возвращенной previewчтениеreadall

Переменные, чтобы читать из файла, заданного как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат имя одной переменной. Можно задать имена переменных в любом порядке.

Чтобы поддержать недопустимые идентификаторы MATLAB как, имена переменных, такие как имена varible, содержащие пробелы и символы non-ASCII, устанавливают PreserveVariableNames параметр к true.

Пример: {'Var3','Var7','Var4'}

Типы данных: cell | string

Форматы выбранных переменных, чтобы читать, заданный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат один спецификатор преобразования. Переменные, чтобы читать обозначаются SelectedVariableNames свойство. Количество векторов символов или строк в SelectedFormats должен совпадать с количеством переменных, чтобы читать.

Можно использовать те же спецификаторы преобразования что textscan функция принимает, включая спецификаторы тот буквенный текст пропуска. Однако вы не можете использовать спецификатор преобразования, который пропускает поле. Таким образом, спецификатор преобразования не может включать символ звездочки (*).

Пример: {'%d','%d'}

Типы данных: cell | string

Объем данных, чтобы читать в вызове read функция, заданная как положительная скалярная величина или 'file'.

  • Если ReadSize положительное целое число, затем каждый вызов read чтения в большей части ReadSize 'Строки' .

  • Если ReadSize isfile, затем каждый вызов read чтения все данные в одном файле.

Когда вы изменяете ReadSize от числового скаляра до 'file' или наоборот, MATLAB сбрасывает datastore к состоянию, где никакие данные не были считаны из него.

Типы данных: double | char | string

Тип выходных данных текстовых переменных, заданных как 'char' или 'string'TextType задает тип данных текстовых переменных, отформатированных с %sQ, или [...].

  • Если TextType ischar, затем выход является массивом ячеек из символьных векторов.

  • Если TextType isstring, затем выход имеет, вводят string.

Типы данных: char | string

Функции объекта

hasdataОпределите, доступны ли данные для чтения
numpartitionsКоличество разделов datastore
partitionРазделите datastore
previewПодмножество данных в datastore
readСчитайте данные в datastore
readallСчитывайте все данные в datastore
resetСброс Datastore к начальному состоянию
transformПреобразуйте datastore
combineОбъедините данные от нескольких datastores

Примеры

свернуть все

Создайте TabularTextDatastore объект, содержащий текстовый файл airlinesmall.csv.

ttds = tabularTextDatastore('airlinesmall.csv')
ttds = 

  TabularTextDatastore with properties:

                      Files: {
                             ' ...\matlab\toolbox\matlab\demos\airlinesmall.csv'
                             }
               FileEncoding: 'UTF-8'
          ReadVariableNames: true
              VariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more}

  Text Format Properties:
             NumHeaderLines: 0
                  Delimiter: ','
               RowDelimiter: '\r\n'
             TreatAsMissing: ''
               MissingValue: NaN

  Advanced Text Format Properties:
            TextscanFormats: {'%f', '%f', '%f' ... and 26 more}
         ExponentCharacters: 'eEdD'
               CommentStyle: ''
                 Whitespace: ' \b\t'
    MultipleDelimitersAsOne: false

  Properties that control the table returned by preview, read, readall:
      SelectedVariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more}
            SelectedFormats: {'%f', '%f', '%f' ... and 26 more}
                   ReadSize: 20000 rows

Создайте datastore из файла примера airlinesmall.csv, который содержит табличные данные.

ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA');

Просмотрите переменные в datastore.

ds.VariableNames
ans = 1x29 cell array
  Columns 1 through 5

    {'Year'}    {'Month'}    {'DayofMonth'}    {'DayOfWeek'}    {'DepTime'}

  Columns 6 through 9

    {'CRSDepTime'}    {'ArrTime'}    {'CRSArrTime'}    {'UniqueCarrier'}

  Columns 10 through 13

    {'FlightNum'}    {'TailNum'}    {'ActualElapsedTime'}    {'CRSElapsedTime'}

  Columns 14 through 18

    {'AirTime'}    {'ArrDelay'}    {'DepDelay'}    {'Origin'}    {'Dest'}

  Columns 19 through 22

    {'Distance'}    {'TaxiIn'}    {'TaxiOut'}    {'Cancelled'}

  Columns 23 through 25

    {'CancellationCode'}    {'Diverted'}    {'CarrierDelay'}

  Columns 26 through 28

    {'WeatherDelay'}    {'NASDelay'}    {'SecurityDelay'}

  Column 29

    {'LateAircraftDelay'}

Измените SelectedVariableNames свойство задать переменные интереса.

ds.SelectedVariableNames = {'Year','Month','Cancelled'};

В качестве альтернативы можно задать переменные интереса, когда вы создаете datastore.

ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA','SelectedVariableNames',{'Year','Month','Cancelled'});

Создайте datastore из файла примера airlinesmall.csv, который содержит табличные данные.

ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA');

Задайте переменные интереса.

ds.SelectedVariableNames = {'Year','Month','UniqueCarrier'};

Просмотрите SelectedFormats свойство.

ds.SelectedFormats
ans = 1x3 cell array
    {'%f'}    {'%f'}    {'%q'}

SelectedFormats свойство указывает что Year и Month переменные будут интерпретированы как столбцы значений с плавающей точкой и UniqueCarrier переменная будет интерпретирована как столбец текста.

Укажите, что первые две переменные должны быть считаны как целые числа со знаком, и третья переменная должна быть считана как категориальное значение путем изменения SelectedFormats свойство.

ds.SelectedFormats = {'%d','%d','%C'};

Предварительно просматривание данных.

T = preview(ds)
T=8×3 table
    Year    Month    UniqueCarrier
    ____    _____    _____________

    1987     10           PS      
    1987     10           PS      
    1987     10           PS      
    1987     10           PS      
    1987     10           PS      
    1987     10           PS      
    1987     10           PS      
    1987     10           PS      

Ограничения

  • Данные о datetime, содержащие день, месяц или часовой пояс, называют на языке внешний к en_US локаль не поддержана. Для нераспознанных форматов datetime задайте формат с помощью TextscanFormats параметр.

Альтернативы

Также можно создать TabularTextDatastore объект с помощью datastore функция. Например, ds = datastore(location,'Type','tabulartext') создает datastore из набора файлов, заданных location.

Введенный в R2014b