Datastore для табличных текстовых файлов
Используйте TabularTextDatastore
объект управлять большим количеством текстовых файлов, содержащих ориентированный на столбец или табличные данные, где набор не обязательно умещается в памяти. Табличные данные являются данными, которые располагаются прямоугольным способом с каждой строкой, имеющей то же количество записей. Можно создать TabularTextDatastore
объект с помощью tabularTextDatastore
функционируйте, задайте его свойства, и затем импортируйте и обработайте функции объекта использования данных.
задает дополнительные параметры и свойства для ttds
= tabularTextDatastore(location
,Name,Value
)ttds
использование одного или нескольких аргументов пары "имя-значение". Например, tabularTextDatastore(location,'FileExtensions',{'.txt','.csv'})
создает datastore только из файлов в location
с расширениями .txt
и .csv
.
location
— Файлы или папки включены в datastoreDsFileSet
объектФайлы или папки, включенные в datastore, заданный как путь или DsFileSet
объект.
path Задайте путь как вектор символов, массив ячеек из символьных векторов, представьте в виде строки скаляр или массив строк, содержа местоположение файлов или папок, которые являются локальными или удаленными.
Локальные файлы или папки — Задают location
как локальный путь к файлам или папкам. Если файлы не находятся в текущей папке, то локальный путь должен задать полные или относительные пути. Файлы в подпапках заданной папки автоматически не включены в datastore. Можно использовать подстановочный символ (*) при определении локального пути. Этот символ указывает, что datastore включает все файлы соответствия или все файлы в соответствующих папках.
Удаленные файлы или папки — Задают location
быть полными путями файлов или папок как универсальный локатор ресурса (URL) формы hdfs:///path_to_file
. Для получения дополнительной информации смотрите работу с Удаленными данными.
DsFileSet
объект — также можно задать location
как DsFileSet
объект. Для получения дополнительной информации смотрите matlab.io.datastore.DsFileSet
.
Когда location
представляет папку, datastore включает только поддерживаемые форматы файлов и игнорирует любой другой формат. Чтобы задать пользовательский список расширений файла, чтобы включать в ваш datastore, смотрите FileExtensions
свойство.
tabularTextDatastore
функция поддерживает эти расширения: .txt
, .csv
, .dat
, .dlm
, .asc
Текст
, или никакое расширение.
Пример: 'file1.csv'
Пример: '../dir/data/file1'
Пример: {'C:\dir\data\file1.csv','C:\dir\data\file2.dat'}
Пример: 'C:\dir\data\*.text'
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
ttds = tabularTextDatastore('C:\dir\textdata','FileExtensions',{'.csv','.txt'})
'IncludeSubfolders'
— Флаг включения подпапкиtrue
или false
| 0 или 1Флаг включения подпапки, заданный как разделенная запятой пара, состоящая из 'IncludeSubfolders'
и true
ложь
, 0, или 1. Задайте true
включать все файлы и подпапки в каждой папке или false
включать только файлы в каждой папке.
Когда вы не задаете 'IncludeSubfolders'
, затем значением по умолчанию является false
.
Пример: 'IncludeSubfolders',true
Типы данных: логический |
double
'FileExtensions'
— Расширения текстового файлаРасширения текстового файла, заданные как разделенная запятой пара, состоящая из 'FileExtensions'
и вектор символов, массив ячеек из символьных векторов, представляет в виде строки скаляр или массив строк. Заданные расширения не требуют поддерживаемого формата. Если вы хотите включать неподдерживаемые расширения, то задайте все расширения. Используйте пустые кавычки ''
представлять файлы без расширений.
Пример: 'FileExtensions','.txt'
Пример: 'FileExtensions',{'.text','.csv'}
Типы данных: char |
cell
| string
'AlternateFileSystemRoots'
— Альтернативные пути к корню файловой системыАльтернативные пути к корню файловой системы, заданные как разделенная запятой пара, состоящая из 'AlternateFileSystemRoots'
и вектор строки или массив ячеек. Используйте 'AlternateFileSystemRoots'
когда вы создаете datastore на локальной машине, но должны получить доступ и обработать данные на другой машине (возможно различной операционной системы). Кроме того, когда обработка данных с помощью Parallel Computing Toolbox™ и MATLAB® Parallel Server™ и данных хранится на локальных машинах с копией доступных данных на облаке другой платформы или кластерных машинах, необходимо использовать 'AlternateFileSystemRoots'
сопоставлять корневые пути.
Чтобы сопоставить набор корневых путей, которые эквивалентны друг другу, задайте 'AlternateFileSystemRoots'
как вектор строки. Например,
["Z:\datasets","/mynetwork/datasets"]
Чтобы сопоставить несколько наборов корневых путей, которые эквивалентны для datastore, задайте 'AlternateFileSystemRoots'
как массив ячеек, содержащий несколько строк, где каждая строка представляет набор эквивалентных корневых путей. Задайте каждую строку в массиве ячеек или как вектор строки или как массив ячеек из символьных векторов. Например:
Задайте 'AlternateFileSystemRoots'
как массив ячеек векторов строки.
{["Z:\datasets", "/mynetwork/datasets"];... ["Y:\datasets", "/mynetwork2/datasets","S:\datasets"]}
В качестве альтернативы задайте 'AlternateFileSystemRoots'
как массив ячеек массива ячеек из символьных векторов.
{{'Z:\datasets','/mynetwork/datasets'};... {'Y:\datasets', '/mynetwork2/datasets','S:\datasets'}}
Значение 'AlternateFileSystemRoots'
должен удовлетворить этим условиям:
Содержит одну или несколько строк, где каждая строка задает набор эквивалентных корневых путей.
Каждая строка задает несколько корневых путей, и каждый корневой путь должен содержать по крайней мере два символа.
Корневые пути уникальны и не являются подпапками друг друга.
Содержит по крайней мере одну корневую запись пути, которая указывает на местоположение файлов.
Для получения дополнительной информации смотрите Настроенный Datastore для Обработки на Различных Машинах или Кластерах.
Пример: ["Z:\datasets","/mynetwork/datasets"]
Типы данных: string
| cell
'TextType'
— Тип выходных данных текстовых переменных'char'
(значение по умолчанию) | 'string'
Тип выходных данных текстовых переменных, заданных как разделенная запятой пара, состоящая из 'TextType'
и любой 'char'
или 'string'
. Если выходная таблица от read
readall
, или preview
функции содержат текстовые переменные, затем 'TextType'
задает тип данных тех переменных для TabularTextDatastore
. Если 'TextType'
ischar
, затем выход является массивом ячеек из символьных векторов. Если 'TextType'
isstring
, затем выход имеет, вводят string
.
Типы данных: char |
string
'DatetimeType'
— Введите для импортированных данных о дате и времени'datetime'
(значение по умолчанию) | 'text'
Введите для импортированных данных о дате и времени, заданных как разделенная запятой пара, состоящая из 'DatetimeType'
и одно из этих значений: 'datetime'
или 'text'
.
Значение | Введите для импортированных данных о дате и времени |
---|---|
'datetime' | MATLAB Для получения дополнительной информации смотрите |
'text' | Если
|
Если заданный TextscanFormats
свойство содержит %D
, затем tabularTextdatastore
игнорирует значение, заданное в DatetimeType
.
Пример: 'DatetimeType','datetime'
Типы данных: char |
string
'DurationType'
— Тип выходных данных данных о длительности'duration'
(значение по умолчанию) | 'text'
Тип выходных данных данных о длительности, заданных как разделенная запятой пара, состоящая из 'DurationType'
и любой 'duration'
или 'text'
.
Значение | Введите для импортированных данных о длительности |
---|---|
'duration' | MATLAB Для получения дополнительной информации смотрите |
'text' | Если
|
Типы данных: char |
string
'DatetimeLocale'
— Локаль, чтобы интерпретировать даты'en_US'
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиЛокаль, чтобы интерпретировать даты, заданные как вектор символов или представить скаляр в виде строки. DatetimeLocale
значение определяет, как функция импорта интерпретирует текст, который представляет даты и времена.
При определении DatetimeLocale
, используйте форму
, где xx
_YY
xx
строчный ISO 639-1 двухбуквенный код, который задает язык и YY
прописная альфа ISO 3166-1 2 кода, которые задают страну.
Эта таблица приводит некоторые общие ценности для локали.
Локаль | Язык | Страна |
---|---|---|
'de_DE' | Немецкий язык | Германия |
'en_GB' | Английский язык | Соединенное Королевство |
'en_US' | Английский язык | Соединенные Штаты |
'es_ES' | Испанский язык | Испания |
'fr_FR' | Французский язык | Франция |
'it_IT' | Итальянский язык | Италия |
'ja_JP' | Японский язык | Япония |
'ko_KR' | Корейский язык | Корея |
'nl_NL' | Нидерландский язык | Нидерланды |
'zh_CN' | Китайский язык (упрощен) | Китай |
Locale
значение определяет, как интерпретированы входные значения. Формат отображения и язык заданы опцией Локали в разделе формата Datetime панели Настроек. Чтобы изменить локаль datetime по умолчанию, см. Настройку параметров командного окна.
Типы данных: char |
string
В дополнение к этим парам "имя-значение" также можно задать свойства на этой странице как пары "имя-значение", за исключением Files
свойство.
TabularTextDatastore
свойства описывают файлы, сопоставленные с TabularTextDatastore
объект. А именно, свойства описывают формат данных в файлах и управляют, как данные должны быть считаны из datastore. Когда вы создаете TabularTextDatastore
объект, функция datastore использует первый файл в Files
свойство определить значения свойств. За исключением Files
свойство, можно задать значение TabularTextDatastore
аргументы пары "имя-значение" использования свойств, когда вы создаете объект datastore. Чтобы просмотреть или изменить свойство после создания объекта, используйте запись через точку:
ds = datastore('airlinesmall.csv'); ds.TreatAsMissing = 'NA'; ds.MissingValue = 0;
Files
— Файлы включены в datastoreФайлы включали в datastore, разрешенный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка являются полным путем к файлу. location
аргумент в tabularTextDatastore
и datastore
функции задают эти файлы.
Первый файл задан Files
свойство определяет имена переменных и данные о формате для всех файлов в datastore.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Пример: {'C:\dir\data\mydata1.csv';'C:\dir\data\mydata2.csv'}
Типы данных: cell
| string
FileEncoding
FileEncoding 'UTF-8'
(значение по умолчанию) | 'US-ASCII'
'Macintosh'
| ...Кодирование файла, заданное как вектор символов или скаляр строки как одно из этих значений.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
| |
|
| |
|
| |
| ||
|
Если каждый файл в datastore помещается в память, то FileEncoding
также может быть одно из этих значений.
|
|
|
|
|
|
|
|
|
|
|
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Типы данных: char |
string
ReadVariableNames
'ReadVariableNames' true
| false
Считайте имена переменных, заданные как логический true
или false
.
Если незаданный, tabularTextDatastore
функция обнаруживает присутствие имен переменных автоматически.
Если true
, затем первая строка незаголовка первого файла определяет имена переменных для данных.
Если false
, затем первая строка незаголовка первого файла содержит первую строку данных. Данные присвоены имена переменных по умолчанию, Var1
, Var2
, и так далее.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Типы данных: логический
PreserveVariableNames
— Отметьте, чтобы сохранить имена переменныхfalse
(значение по умолчанию) | true
Отметьте, чтобы сохранить имена переменных, заданные как разделенная запятой пара, состоящая из PreserveVariableNames
и любой true
, или false
.
true
— Сохраните имена переменных, которые не являются допустимыми идентификаторами MATLAB, такими как имена переменных, которые включают символы non-ASCII и пробелы.
false
— Преобразуйте недопустимые имена переменных (как определено isvarname
функция) к допустимым идентификаторам MATLAB.
Начиная в R2019b, имена переменных и имена строки могут включать любые символы, включая символы non-ASCII и пробелы. Кроме того, они могут запустить с любых символов, не только обозначает буквами. Переменная и имена строки не должны быть допустимыми идентификаторами MATLAB (как определено isvarname
функция. Чтобы сохранить эти имена переменных и имена строки, установите PreserveVariableNames
к true
.
VariableNames
— Имена переменныхИмена переменных в datastore, заданном как массив ячеек из символьных векторов или массив строк. Задайте имена переменных в порядке, в котором они появляются в файлах. Если вы не задаете имена переменных, они обнаруживаются от первой линии незаголовка в первом файле datastore. При изменении VariableNames
свойство, количество новых имен переменных должно совпадать с количеством исходных имен переменных.
Чтобы поддержать недопустимые идентификаторы MATLAB как, имена переменных, такие как имена varible, содержащие пробелы и символы non-ASCII, устанавливают PreserveVariableNames
параметр к true
.
Если ReadVariableNames
false
, затем VariableNames
значения по умолчанию к {'Var1','Var2', ...}
.
Пример: {'Time','Name','Quantity'}
Типы данных: cell
| string
NumHeaderLines
— Количество линий, чтобы пропуститьКоличество линий, чтобы пропустить в начале файла, заданного как неотрицательное целое число. Если незаданный, tabularTextDatastore
функция обнаруживает количество линий, чтобы пропустить автоматически.
tabularTextDatastore
функция игнорирует конкретное количество линий заголовка прежде, чем считать имена переменных или данные.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Типы данных: double
Delimiter
— Символы разделителя полейСимволы разделителя полей, заданные как вектор символов, массив ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Задайте несколько разделителей в массиве ячеек из символьных векторов или массиве строк. Если незаданный, tabularTextDatastore
функция обнаруживает разделитель автоматически.
Пример: '|'
Пример: {';','*'}
Повторные символы-разделители в файле интерпретированы, как разделяют разделители пустыми полями между ними. Если незаданный, функция чтения обнаруживает разделитель автоматически по умолчанию.
Когда вы задаете одну из следующих escape-последовательностей как разделитель, она преобразована в соответствующий управляющий символ.
\b | Клавиша Backspace |
\n | Новая строка |
\r | Возврат каретки |
\t | Вкладка |
\\ | Обратная косая черта (\ ) |
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Типы данных: char |
cell
| string
RowDelimiter
— Символ-разделитель строки\r\n
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиСимвол-разделитель строки, заданный как вектор символов или скаляр строки, который должен быть или отдельным символом или одним из '\r'
N
, или '\r\n'
.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Пример: ':'
Типы данных: char |
string
TreatAsMissing
— Числовые значения, чтобы обработать как пропавшие без вести''
(значение по умолчанию) | вектор символов | массив ячеек из символьных векторов | представляет скаляр в виде строки | массив строкЧисловые значения, чтобы обработать как отсутствующие значения, заданные как односимвольный вектор, массив ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Значения, заданные как TreatAsMissing
подставлены со значением, заданным в MissingValue
свойство. Например, если MissingValue
задан, чтобы быть NaN
, и TreatAsMissing
задан как 'NA'
. Затем в импортированных данных, всех случаях 'NA'
заменяются NaN
.
Эта опция только применяется к числовым полям. Кроме того, это свойство эквивалентно TreatAsEmpty
аргумент пары "имя-значение" для textscan
функция.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Пример: 'NA'
Пример: '-99'
Пример: {'-',''}
Типы данных: char |
cell
| string
MissingValue
— Значение для пропавших без вести числовых полейNaN
(значение по умолчанию) | скалярЗначение для пропавших без вести числовых полей в файлах разделенного текста, заданных как скаляр. Это свойство эквивалентно EmptyValue
аргумент пары "имя-значение" для textscan
функция.
Типы данных: double
TextscanFormats
— Формат поля данныхФормат поля данных, заданный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат один спецификатор преобразования.
Когда вы задаете или изменяете TextscanFormats
свойство, можно использовать те же спецификаторы преобразования что textscan
функция принимает для formatSpec
аргумент. Допустимые значения для TextscanFormats
включайте спецификаторы преобразования что поля игнорируемых данных с помощью звездочки (*) символ и единицы тот буквенный текст пропуска. Количество спецификаторов преобразования должно совпадать с количеством переменных в VariableNames
свойство.
Если значение TextscanFormats
включает спецификаторы преобразования что поля игнорируемых данных с помощью символов звездочки (*), затем значение SelectedVariableNames
свойство автоматически обновляется. MATLAB использует %*q
спецификатор преобразования к полям игнорируемых данных не использован SelectedVariableNames
свойство и обработки полевое содержимое как векторы буквенного символа. Для файлов с фиксированной шириной укажите на пропущенное поле с помощью соответствующего спецификатора преобразования наряду с шириной поля. Например, %*52c
пропускает поле, которое содержит 52 символа.
Если вы не задаете значение для TextscanFormats
, затем datastore
определяет формат полей данных путем сканирования текста от первой линии незаголовка в первом файле datastore.
Пример: {'%s','%s','%f'}
Типы данных: cell
| string
ExponentCharacters
ExponentCharacters 'eEdD'
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиСимволы экспоненты, заданные как вектор символов или скаляр строки. Символами экспоненты по умолчанию является e
E
D
, и D
.
Типы данных: char |
string
CommentStyle
— Стиль комментариев''
(значение по умолчанию) | вектор символов | массив ячеек из символьных векторов | представляет скаляр в виде строки | массив строкСтиль комментариев в файле, заданном как вектор символов, массив ячеек из символьных векторов, представляет в виде строки скаляр или массив строк.
Например, задайте '%'
проигнорировать символы после текста на той же линии. Задайте {'/*','*/'}
проигнорировать символы между текстом.
При чтении из TabularTextDatastore
, read
функционируйте проверки на комментарии только в начале каждого поля, не в поле.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Пример: 'CommentStyle',{'/*', '*/'}
Типы данных: char |
cell
| string
Whitespace
— Пробельные символы' \b\t'
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиПробельные символы, заданные как вектор символов или скаляр строки одного или нескольких символов.
Когда вы задаете одну из следующих escape-последовательностей как любой пробельный символ, datastore
функция преобразует ту последовательность в соответствующий управляющий символ.
\b | Клавиша Backspace |
\n | Новая строка |
\r | Возврат каретки |
\t | Вкладка |
\\ | Обратная косая черта (\ ) |
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
Пример: ' \b\t'
Типы данных: char |
string
MultipleDelimitersAsOne
— Несколько обработка разделителя0 (false)
(значение по умолчанию) | 1 (true)
Несколько обработка разделителя, заданная как любой true
или false
. Если true
, затем datastore
обрабатывает последовательные разделители как один разделитель. Повторные разделители, разделенные пробелом, также обработаны как один разделитель.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения TabularTextDatastore
свойства.
preview
чтение
readall
SelectedVariableNames
— Переменные, чтобы читатьПеременные, чтобы читать из файла, заданного как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат имя одной переменной. Можно задать имена переменных в любом порядке.
Чтобы поддержать недопустимые идентификаторы MATLAB как, имена переменных, такие как имена varible, содержащие пробелы и символы non-ASCII, устанавливают PreserveVariableNames
параметр к true
.
Пример: {'Var3','Var7','Var4'}
Типы данных: cell
| string
SelectedFormats
— Форматы выбранных переменныхФорматы выбранных переменных, чтобы читать, заданный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат один спецификатор преобразования. Переменные, чтобы читать обозначаются SelectedVariableNames
свойство. Количество векторов символов или строк в SelectedFormats
должен совпадать с количеством переменных, чтобы читать.
Можно использовать те же спецификаторы преобразования что textscan
функция принимает, включая спецификаторы тот буквенный текст пропуска. Однако вы не можете использовать спецификатор преобразования, который пропускает поле. Таким образом, спецификатор преобразования не может включать символ звездочки (*).
Пример: {'%d','%d'}
Типы данных: cell
| string
ReadSize
— Объем данных, чтобы читать'file'
Объем данных, чтобы читать в вызове read
функция, заданная как положительная скалярная величина или 'file'
.
Если ReadSize
положительное целое число, затем каждый вызов read
чтения в большей части ReadSize
'Строки' .
Если ReadSize
isfile
, затем каждый вызов read
чтения все данные в одном файле.
Когда вы изменяете ReadSize
от числового скаляра до 'file'
или наоборот, MATLAB сбрасывает datastore к состоянию, где никакие данные не были считаны из него.
Типы данных: double |
char
| string
TextType
— Тип выходных данных текстовых переменных'char'
(значение по умолчанию) | 'string'
Тип выходных данных текстовых переменных, заданных как 'char'
или 'string'
TextType
задает тип данных текстовых переменных, отформатированных с %s
Q
, или [...]
.
Если TextType
ischar
, затем выход является массивом ячеек из символьных векторов.
Если TextType
isstring
, затем выход имеет, вводят string
.
Типы данных: char |
string
hasdata | Определите, доступны ли данные для чтения |
numpartitions | Количество разделов datastore |
partition | Разделите datastore |
preview | Подмножество данных в datastore |
read | Считайте данные в datastore |
readall | Считывайте все данные в datastore |
reset | Сброс Datastore к начальному состоянию |
transform | Преобразуйте datastore |
combine | Объедините данные от нескольких datastores |
Создайте TabularTextDatastore
объект, содержащий текстовый файл airlinesmall.csv
.
ttds = tabularTextDatastore('airlinesmall.csv')
ttds = TabularTextDatastore with properties: Files: { ' ...\matlab\toolbox\matlab\demos\airlinesmall.csv' } FileEncoding: 'UTF-8' ReadVariableNames: true VariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more} Text Format Properties: NumHeaderLines: 0 Delimiter: ',' RowDelimiter: '\r\n' TreatAsMissing: '' MissingValue: NaN Advanced Text Format Properties: TextscanFormats: {'%f', '%f', '%f' ... and 26 more} ExponentCharacters: 'eEdD' CommentStyle: '' Whitespace: ' \b\t' MultipleDelimitersAsOne: false Properties that control the table returned by preview, read, readall: SelectedVariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more} SelectedFormats: {'%f', '%f', '%f' ... and 26 more} ReadSize: 20000 rows
Создайте datastore из файла примера airlinesmall.csv
, который содержит табличные данные.
ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA');
Просмотрите переменные в datastore.
ds.VariableNames
ans = 1x29 cell array
Columns 1 through 5
{'Year'} {'Month'} {'DayofMonth'} {'DayOfWeek'} {'DepTime'}
Columns 6 through 9
{'CRSDepTime'} {'ArrTime'} {'CRSArrTime'} {'UniqueCarrier'}
Columns 10 through 13
{'FlightNum'} {'TailNum'} {'ActualElapsedTime'} {'CRSElapsedTime'}
Columns 14 through 18
{'AirTime'} {'ArrDelay'} {'DepDelay'} {'Origin'} {'Dest'}
Columns 19 through 22
{'Distance'} {'TaxiIn'} {'TaxiOut'} {'Cancelled'}
Columns 23 through 25
{'CancellationCode'} {'Diverted'} {'CarrierDelay'}
Columns 26 through 28
{'WeatherDelay'} {'NASDelay'} {'SecurityDelay'}
Column 29
{'LateAircraftDelay'}
Измените SelectedVariableNames
свойство задать переменные интереса.
ds.SelectedVariableNames = {'Year','Month','Cancelled'};
В качестве альтернативы можно задать переменные интереса, когда вы создаете datastore.
ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA','SelectedVariableNames',{'Year','Month','Cancelled'});
Создайте datastore из файла примера airlinesmall.csv
, который содержит табличные данные.
ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA');
Задайте переменные интереса.
ds.SelectedVariableNames = {'Year','Month','UniqueCarrier'};
Просмотрите SelectedFormats
свойство.
ds.SelectedFormats
ans = 1x3 cell array
{'%f'} {'%f'} {'%q'}
SelectedFormats
свойство указывает что Year
и Month
переменные будут интерпретированы как столбцы значений с плавающей точкой и UniqueCarrier
переменная будет интерпретирована как столбец текста.
Укажите, что первые две переменные должны быть считаны как целые числа со знаком, и третья переменная должна быть считана как категориальное значение путем изменения SelectedFormats
свойство.
ds.SelectedFormats = {'%d','%d','%C'};
Предварительно просматривание данных.
T = preview(ds)
T=8×3 table
Year Month UniqueCarrier
____ _____ _____________
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
Данные о datetime, содержащие день, месяц или часовой пояс, называют на языке внешний к en_US
локаль не поддержана. Для нераспознанных форматов datetime задайте формат с помощью TextscanFormats
параметр.
Также можно создать TabularTextDatastore
объект с помощью datastore
функция. Например, ds = datastore(location,'Type','tabulartext')
создает datastore из набора файлов, заданных location
.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.