Datastore для табличных текстовых файлов
Используйте объект TabularTextDatastore
управлять большим количеством текстовых файлов, содержащих ориентированный на столбец или табличные данные, где набор не обязательно умещается в памяти. Табличные данные являются данными, которые располагаются прямоугольным способом с каждой строкой, имеющей то же количество записей. Можно создать объект TabularTextDatastore
с помощью функции tabularTextDatastore
, задать ее свойства, и затем импортировать и обработать функции объекта использования данных.
ttds = tabularTextDatastore(location)
ttds = tabularTextDatastore(location,Name,Value)
задает дополнительные параметры и свойства для ttds
= tabularTextDatastore(location
,Name,Value
)ttds
с помощью одного или нескольких аргументов пары "имя-значение". Например, tabularTextDatastore(location,'FileExtensions',{'.txt','.csv'})
создает datastore только из файлов в location
с расширениями .txt
и .csv
.
местоположение
Файлы или папки включены в datastoreDsFileSet
Файлы или папки, включенные в datastore, заданный как путь или объект DsFileSet
.
path Задайте путь как вектор символов, массив ячеек из символьных векторов, представьте в виде строки скаляр или массив строк, содержа местоположение файлов или папок, которые являются локальными или удаленными.
Локальные файлы или папки — Задают location
как локальный путь к файлам или папкам. Если файлы не находятся в текущей папке, то локальный путь должен задать полные или относительные пути. Файлы в подпапках заданной папки автоматически не включены в datastore. Можно использовать подстановочный символ (*) при определении локального пути. Этот символ указывает, что datastore включает все файлы соответствия или все файлы в соответствующих папках.
Удаленные файлы или папки — Задают location
, чтобы быть полными путями файлов или папок как интернационализировавший идентификатор ресурса (IRI) формы hdfs:///path_to_file
. Для получения дополнительной информации смотрите работу с Удаленными данными.
Объект DsFileSet
— также можно задать location
как объект DsFileSet
. Для получения дополнительной информации смотрите matlab.io.datastore.DsFileSet
.
Когда location
представляет папку, datastore включает только поддерживаемые форматы файлов и игнорирует любой другой формат. Чтобы задать пользовательский список расширений файла, чтобы включать в ваш datastore, смотрите свойство FileExtensions
.
Функция tabularTextDatastore
поддерживает эти расширения: .txt
, .csv
, .dat
, .dlm
, .asc
, .text
или никакое расширение.
Пример: 'file1.csv'
Пример: '../dir/data/file1'
Пример: {'C:\dir\data\file1.csv','C:\dir\data\file2.dat'}
Пример: 'C:\dir\data\*.text'
Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми.
Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение.
Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.
ttds = tabularTextDatastore('C:\dir\textdata','FileExtensions',{'.csv','.txt'})
'IncludeSubfolders'
Флаг включения подпапкиtrue
или false
| 0 или 1Флаг включения подпапки, заданный как пара, разделенная запятой, состоящая из 'IncludeSubfolders'
и true
, false
, 0, или 1. Задайте true
, чтобы включать все файлы и подпапки в каждой папке или false
, чтобы включать только файлы в каждой папке.
Когда вы не задаете 'IncludeSubfolders'
, затем значением по умолчанию является false
.
Пример: 'IncludeSubfolders',true
Типы данных: logical
| double
'FileExtensions'
Расширения текстового файлаРасширения текстового файла, заданные как пара, разделенная запятой, состоящая из 'FileExtensions'
и вектора символов, массива ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Заданные расширения не требуют поддерживаемого формата. Если вы хотите включать неподдерживаемые расширения, то задайте все расширения. Используйте пустые кавычки ''
, чтобы представлять файлы без расширений.
Пример: 'FileExtensions','.txt'
Пример: 'FileExtensions',{'.text','.csv'}
Типы данных: char
| cell
| string
'AlternateFileSystemRoots'
— Альтернативные пути к корню файловой системыАльтернативные пути к корню файловой системы, заданные как пара, разделенная запятой, состоящая из 'AlternateFileSystemRoots'
и вектора строки или массива ячеек. Используйте 'AlternateFileSystemRoots'
, когда вы создадите datastore на локальной машине, но должны будете получить доступ и обработать данные на другой машине (возможно различной операционной системы). Кроме того, когда обработка данных с помощью Parallel Computing Toolbox™ и MATLAB® Parallel Server™ и данных хранится на локальных машинах с копией доступных данных на облаке другой платформы или кластерных машинах, необходимо использовать 'AlternateFileSystemRoots'
, чтобы сопоставить корневые пути.
Чтобы сопоставить набор корневых путей, которые эквивалентны друг другу, задайте 'AlternateFileSystemRoots'
как вектор строки. Например,
["Z:\datasets","/mynetwork/datasets"]
Чтобы сопоставить несколько наборов корневых путей, которые эквивалентны для datastore, задайте 'AlternateFileSystemRoots'
как массив ячеек, содержащий несколько строк, где каждая строка представляет набор эквивалентных корневых путей. Задайте каждую строку в массиве ячеек или как вектор строки или как массив ячеек из символьных векторов. Например:
Задайте 'AlternateFileSystemRoots'
как массив ячеек векторов строки.
{["Z:\datasets", "/mynetwork/datasets"];... ["Y:\datasets", "/mynetwork2/datasets","S:\datasets"]}
Также задайте 'AlternateFileSystemRoots'
как массив ячеек массива ячеек из символьных векторов.
{{'Z:\datasets','/mynetwork/datasets'};... {'Y:\datasets', '/mynetwork2/datasets','S:\datasets'}}
Значение 'AlternateFileSystemRoots'
должно удовлетворить эти условия:
Содержит одну или несколько строк, где каждая строка задает набор эквивалентных корневых путей.
Каждая строка задает несколько корневых путей, и каждый корневой путь должен содержать по крайней мере два символа.
Корневые пути уникальны и не являются подпапками друг друга.
Содержит по крайней мере одну корневую запись пути, которая указывает на местоположение файлов.
Для получения дополнительной информации смотрите Настроенный Datastore для Обработки на Различных Машинах или Кластерах.
Пример: ["Z:\datasets","/mynetwork/datasets"]
Типы данных: string
| cell
TextType
Тип выходных данных текстовых переменных'char'
(значение по умолчанию) | 'string'
Тип выходных данных текстовых переменных, заданных как пара, разделенная запятой, состоящая из 'TextType'
и или 'char'
или 'string'
. Если выходная таблица от read
, readall
или функций preview
содержит текстовые переменные, то 'TextType'
задает тип данных тех переменных для TabularTextDatastore
. Если 'TextType'
является 'char'
, то вывод является массивом ячеек из символьных векторов. Если 'TextType'
является 'string'
, то вывод имеет, вводят string
.
Типы данных: char | string
'DatetimeType'
Введите для импортированных данных о дате и времени'datetime'
(значение по умолчанию) | 'text'
Введите для импортированных данных о дате и времени, заданных как пара, разделенная запятой, состоящая из 'DatetimeType'
и одно из этих значений: 'datetime'
или 'text'
.
Значение | Введите для импортированных данных о дате и времени |
---|---|
'datetime' | MATLAB тип данных Для получения дополнительной информации смотрите |
'text' | Если
|
Если заданное свойство TextscanFormats
содержит %D
, то tabularTextdatastore
игнорирует значение, заданное в DatetimeType
.
Пример: 'DatetimeType','datetime'
Типы данных: char | string
'DurationType'
— Тип выходных данных данных о длительности'duration'
(значение по умолчанию) | 'text'
Тип выходных данных данных о длительности, заданных как пара, разделенная запятой, состоящая из 'DurationType'
и или 'duration'
или 'text'
.
Значение | Введите для импортированных данных о длительности |
---|---|
'duration' | MATLAB тип данных Для получения дополнительной информации смотрите |
'text' | Если
|
Типы данных: char | string
'DatetimeLocale'
Локаль, чтобы интерпретировать даты'en_US'
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиЛокаль, чтобы интерпретировать даты, заданные как вектор символов или представить скаляр в виде строки. Значение DatetimeLocale
определяет, как функция импорта интерпретирует текст, который представляет даты и времена.
При определении DatetimeLocale
используйте форму
, где xx_YY
xx
является строчный ISO 639-1 двухбуквенный код, который задает язык, и YY
является прописной альфой ISO 3166-1 2 кода, которые задают страну.
Эта таблица приводит некоторые общие ценности для локали.
Локаль | Язык | Страна |
---|---|---|
'de_DE' | Немецкий язык | Германия |
'en_GB' | Английский язык | Соединенное Королевство |
'en_US' | Английский язык | Соединенные Штаты |
'es_ES' | Испанский язык | Испания |
'fr_FR' | Французский язык | Франция |
'it_IT' | Итальянский язык | Италия |
'ja_JP' | Японский язык | Япония |
'ko_KR' | Корейский язык | Корея |
'nl_NL' | Нидерландский язык | Нидерланды |
'zh_CN' | Китайский язык (упрощен) | Китай |
Значение Locale
определяет, как интерпретированы входные значения. Формат отображения и язык заданы опцией Локали в разделе формата Datetime панели Настроек. Чтобы изменить локаль datetime по умолчанию, см. Настройку параметров командного окна.
Типы данных: char | string
В дополнение к этим парам "имя-значение" также можно задать свойства на этой странице как пары "имя-значение", за исключением свойства Files
.
Свойства TabularTextDatastore
описывают файлы, сопоставленные с объектом TabularTextDatastore
. А именно, свойства описывают формат данных в файлах и управляют, как данные должны быть считаны из datastore. Когда вы создаете объект TabularTextDatastore
, функция datastore использует первый файл в свойстве Files
определить значения свойств. За исключением свойства Files
, можно задать значение аргументов пары "имя-значение" использования свойств TabularTextDatastore
, когда вы создаете объект datastore. Чтобы просмотреть или изменить свойство после создания объекта, используйте запись через точку:
ds = datastore('airlinesmall.csv'); ds.TreatAsMissing = 'NA'; ds.MissingValue = 0;
Files
— Файлы включены в datastoreФайлы включали в datastore, разрешенный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка являются полным путем к файлу. Аргумент location
в tabularTextDatastore
и функциях datastore
задает эти файлы.
Первый файл, заданный свойством Files
, определяет имена переменных и данные о формате для всех файлов в datastore.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Пример: {'C:\dir\data\mydata1.csv';'C:\dir\data\mydata2.csv'}
Типы данных: cell
| string
FileEncoding
FileEncoding 'UTF-8'
(значение по умолчанию) | 'US-ASCII'
'Macintosh'
|...Кодирование файла, заданное как вектор символов или скаляр строки как одно из этих значений.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
| |
|
| |
|
| |
| ||
|
Если каждый файл в datastore помещается в память, то FileEncoding
также может быть одним из этих значений.
|
|
|
|
|
|
|
|
|
|
|
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Типы данных: char | string
'ReadVariableNames'
'ReadVariableNames' true
| false
Считайте имена переменных, заданные как логический true
или false
.
Если незаданный, функция tabularTextDatastore
обнаруживает присутствие имен переменных автоматически.
Если true
, то первая строка незаголовка первого файла определяет имена переменных для данных.
Если false
, то первая строка незаголовка первого файла содержит первую строку данных. Данные присвоены имена переменных по умолчанию, Var1
, Var2
, и так далее.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Типы данных: логический
Имена переменных
Имена переменныхИмена переменных в datastore, заданном как массив ячеек из символьных векторов или массив строк. Задайте имена переменных в порядке, в котором они появляются в файлах. Если вы не задаете имена переменных, они обнаруживаются от первой строки незаголовка в первом файле datastore. При изменении свойства VariableNames
количество новых имен переменных должно совпадать с количеством исходных имен переменных.
Если ReadVariableNames
является false
, то значения по умолчанию VariableNames
к {'Var1','Var2', ...}
.
Пример: {'Time','Name','Quantity'}
Типы данных: cell
| string
NumHeaderLines
Количество строк, чтобы пропуститьКоличество строк, чтобы пропустить в начале файла, заданного как неотрицательное целое число. Если незаданный, функция tabularTextDatastore
обнаруживает количество строк, чтобы пропустить автоматически.
Функция tabularTextDatastore
игнорирует конкретное количество строк заголовка прежде, чем считать имена переменных или данные.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Типы данных: double
Delimiter
— Символы разделителя полейСимволы разделителя полей, заданные как вектор символов, массив ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Задайте несколько разделителей в массиве ячеек из символьных векторов или массиве строк. Если незаданный, функция tabularTextDatastore
обнаруживает разделитель автоматически.
Пример: '|'
Пример: {';','*'}
Повторные символы-разделители в файле интерпретированы, как разделяют разделители пустыми полями между ними. Если незаданный, функция чтения обнаруживает разделитель автоматически по умолчанию.
Когда вы задаете одну из следующих escape-последовательностей как разделитель, она преобразована в соответствующий управляющий символ.
\b | Клавиша Backspace |
\n | Новая строка |
\r | Возврат каретки |
\t | Вкладка |
\\ | Наклонная черта влево (\ ) |
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Типы данных: char
| cell
| string
RowDelimiter
Символ-разделитель строки\r\n
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиСимвол-разделитель строки, заданный как вектор символов или скаляр строки, который должен быть или отдельным символом или одним из '\r'
, '\n'
или '\r\n'
.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Пример: ':'
Типы данных: char | string
'TreatAsMissing'
Числовые значения, чтобы обработать как пропавшие без вести''
(значение по умолчанию) | вектор символов | массив ячеек из символьных векторов | представляет скаляр в виде строки | массив строкЧисловые значения, чтобы обработать как отсутствующие значения, заданные как односимвольный вектор, массив ячеек из символьных векторов, представляют в виде строки скаляр или массив строк. Значениями, заданными как TreatAsMissing
, заменяют со значением, заданным в свойстве MissingValue
. Например, если MissingValue
задан, чтобы быть NaN
, и TreatAsMissing
задан как 'NA'
. Затем в импортированных данных все случаи 'NA'
заменяются NaN
.
Эта опция только применяется к числовым полям. Кроме того, это свойство эквивалентно аргументу пары "имя-значение" TreatAsEmpty
для функции textscan
.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Пример: 'NA'
Пример: '-99'
Пример: {'-',''}
Типы данных: char
| cell
| string
MissingValue
Значение для пропавших без вести числовых полейNaN
(значение по умолчанию) | скалярЗначение для пропавших без вести числовых полей в файлах разделенного текста, заданных как скаляр. Это свойство эквивалентно аргументу пары "имя-значение" EmptyValue
для функции textscan
.
Типы данных: double
TextscanFormats
Формат поля данныхФормат поля данных, заданный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат один спецификатор преобразования.
Когда вы задаете или изменяете свойство TextscanFormats
, можно использовать те же спецификаторы преобразования, которые функция textscan
принимает для аргумента formatSpec
. Допустимые значения для TextscanFormats
включают спецификаторы преобразования что поля игнорируемых данных с помощью звездочки (*) символ и единицы тот буквенный текст пропуска. Количество спецификаторов преобразования должно совпадать с количеством переменных в свойстве VariableNames
.
Если значение TextscanFormats
включает спецификаторы преобразования, что поля игнорируемых данных с помощью символов звездочки (*), то значение свойства SelectedVariableNames
автоматически обновляет. MATLAB использует спецификатор преобразования %*q
для полей игнорируемых данных, не использованных свойством SelectedVariableNames
, и обрабатывает полевое содержимое как векторы буквенного символа. Для файлов с фиксированной шириной укажите на пропущенное поле с помощью соответствующего спецификатора преобразования наряду с шириной поля. Например, %*52c
пропускает поле, которое содержит 52 символа.
Если вы не задаете значение для TextscanFormats
, то datastore
определяет формат полей данных путем сканирования текста от первой строки незаголовка в первом файле datastore.
Пример: {'%s','%s','%f'}
Типы данных: cell
| string
ExponentCharacters
ExponentCharacters 'eEdD'
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиСимволы экспоненты, заданные как вектор символов или скаляр строки. Символами экспоненты по умолчанию является e
, E
, d
и D
.
Типы данных: char | string
CommentStyle
Стиль комментариев''
(значение по умолчанию) | вектор символов | массив ячеек из символьных векторов | представляет скаляр в виде строки | массив строкСтиль комментариев в файле, заданном как вектор символов, массив ячеек из символьных векторов, представляет в виде строки скаляр или массив строк.
Например, задайте '%'
, чтобы проигнорировать символы после текста на той же строке. Задайте {'/*','*/'}
, чтобы проигнорировать символы между текстом.
При чтении из TabularTextDatastore
read
функционирует проверки на комментарии только в начале каждого поля, не в поле.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Пример: 'CommentStyle',{'/*', '*/'}
Типы данных: char
| cell
| string
Whitespace
— Пробельные символы' \b\t'
(значение по умолчанию) | вектор символов | представляет скаляр в виде строкиПробельные символы, заданные как вектор символов или скаляр строки одного или нескольких символов.
Когда вы задаете одну из следующих escape-последовательностей как любой пробельный символ, функция datastore
преобразовывает ту последовательность в соответствующий управляющий символ.
\b | Клавиша Backspace |
\n | Новая строка |
\r | Возврат каретки |
\t | Вкладка |
\\ | Наклонная черта влево (\ ) |
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
Пример: ' \b\t'
Типы данных: char | string
MultipleDelimitersAsOne
Несколько обработка разделителя0 (false)
(значение по умолчанию) | 1 (true)
Несколько обработка разделителя, заданная или как true
или как false
. Если true
, то datastore
обрабатывает последовательные разделители как один разделитель. Повторные разделители, разделенные пробелом, также обработаны как один разделитель.
Когда вы изменяете значение этого свойства, функция datastore переоценивает значения свойств TabularTextDatastore
.
preview
, read
, readall
SelectedVariableNames
Переменные, чтобы читатьПеременные, чтобы читать из файла, заданного как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат имя одной переменной. Можно задать имена переменных в любом порядке.
Пример: {'Var3','Var7','Var4'}
Типы данных: cell
| string
SelectedFormats
Форматы выбранных переменныхФорматы выбранных переменных, чтобы читать, заданный как массив ячеек из символьных векторов или массив строк, где каждый вектор символов или строка содержат один спецификатор преобразования. Переменные, чтобы читать обозначаются свойством SelectedVariableNames
. Количество векторов символов или строк в SelectedFormats
должно совпадать с количеством переменных, чтобы читать.
Можно использовать те же спецификаторы преобразования, которые функция textscan
принимает, включая спецификаторы тот буквенный текст пропуска. Однако вы не можете использовать спецификатор преобразования, который пропускает поле. Таким образом, спецификатор преобразования не может включать символ звездочки (*).
Пример: {'%d','%d'}
Типы данных: cell
| string
ReadSize
Объем данных, чтобы читать'file'
Объем данных, чтобы читать в вызове функции read
, заданной как положительная скалярная величина или 'file'
.
Если ReadSize
является положительным целым числом, то каждый вызов чтений read
в большинстве строк ReadSize
.
Если ReadSize
является 'file'
, то каждый вызов read
считывает все данные в одном файле.
Когда вы изменяете ReadSize
от числового скаляра до 'file'
или наоборот, MATLAB сбрасывает datastore к состоянию, где никакие данные не были считаны из него.
Типы данных: double
| char
| string
TextType
Тип выходных данных текстовых переменных'char'
(значение по умолчанию) | 'string'
Тип выходных данных текстовых переменных, заданных как 'char'
или 'string'
. TextType
задает тип данных текстовых переменных, отформатированных с %s
, %q
или [...]
.
Если TextType
является 'char'
, то вывод является массивом ячеек из символьных векторов.
Если TextType
является 'string'
, то вывод имеет, вводят string
.
Типы данных: char | string
hasdata | Определите, доступны ли данные для чтения |
numpartitions | Количество разделов datastore |
partition | Разделите datastore |
preview | Подмножество данных в datastore |
read | Считайте данные в datastore |
readall | Считывайте все данные в datastore |
reset | Сброс Datastore к начальному состоянию |
transform | Преобразуйте datastore |
combine | Объедините данные от нескольких datastores |
Создайте объект TabularTextDatastore
, содержащий текстовый файл airlinesmall.csv
.
ttds = tabularTextDatastore('airlinesmall.csv')
ttds = TabularTextDatastore with properties: Files: { ' ...\matlab\toolbox\matlab\demos\airlinesmall.csv' } FileEncoding: 'UTF-8' ReadVariableNames: true VariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more} Text Format Properties: NumHeaderLines: 0 Delimiter: ',' RowDelimiter: '\r\n' TreatAsMissing: '' MissingValue: NaN Advanced Text Format Properties: TextscanFormats: {'%f', '%f', '%f' ... and 26 more} ExponentCharacters: 'eEdD' CommentStyle: '' Whitespace: ' \b\t' MultipleDelimitersAsOne: false Properties that control the table returned by preview, read, readall: SelectedVariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more} SelectedFormats: {'%f', '%f', '%f' ... and 26 more} ReadSize: 20000 rows
Создайте datastore из файла примера airlinesmall.csv
, который содержит табличные данные.
ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA');
Просмотрите переменные в datastore.
ds.VariableNames
ans = 1x29 cell array
Columns 1 through 5
{'Year'} {'Month'} {'DayofMonth'} {'DayOfWeek'} {'DepTime'}
Columns 6 through 9
{'CRSDepTime'} {'ArrTime'} {'CRSArrTime'} {'UniqueCarrier'}
Columns 10 through 13
{'FlightNum'} {'TailNum'} {'ActualElapsedTime'} {'CRSElapsedTime'}
Columns 14 through 18
{'AirTime'} {'ArrDelay'} {'DepDelay'} {'Origin'} {'Dest'}
Columns 19 through 22
{'Distance'} {'TaxiIn'} {'TaxiOut'} {'Cancelled'}
Columns 23 through 25
{'CancellationCode'} {'Diverted'} {'CarrierDelay'}
Columns 26 through 28
{'WeatherDelay'} {'NASDelay'} {'SecurityDelay'}
Column 29
{'LateAircraftDelay'}
Измените свойство SelectedVariableNames
задать переменные интереса.
ds.SelectedVariableNames = {'Year','Month','Cancelled'};
Также можно задать переменные интереса, когда вы создаете datastore.
ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA','SelectedVariableNames',{'Year','Month','Cancelled'});
Создайте datastore из файла примера airlinesmall.csv
, который содержит табличные данные.
ds = tabularTextDatastore('airlinesmall.csv','TreatAsMissing','NA');
Задайте переменные интереса.
ds.SelectedVariableNames = {'Year','Month','UniqueCarrier'};
Просмотрите свойство SelectedFormats
.
ds.SelectedFormats
ans = 1x3 cell array
{'%f'} {'%f'} {'%q'}
Свойство SelectedFormats
указывает, что переменные Year
и Month
будут интерпретированы как столбцы значений с плавающей точкой, и переменная UniqueCarrier
будет интерпретирована как столбец текста.
Укажите, что первые две переменные должны быть считаны как целые числа со знаком, и третья переменная должна быть считана как категориальное значение путем изменения свойства SelectedFormats
.
ds.SelectedFormats = {'%d','%d','%C'};
Предварительно просматривание данных.
T = preview(ds)
T=8×3 table
Year Month UniqueCarrier
____ _____ _____________
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
1987 10 PS
Данные о datetime, содержащие день, месяц или имена часового пояса на языке, внешнем к локали en_US
, не поддержаны. Для нераспознанных форматов datetime задайте формат с помощью параметра TextscanFormats
.
Также можно создать объект TabularTextDatastore
с помощью функции datastore
. Например, ds = datastore(location,'Type','tabulartext')
создает datastore из набора файлов, заданных location
.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.