Суперклассы:
Предоставьте быстрый и эффективный доступ к файлу крупного текста с записями неоднородного размера
BioIndexedFile
класс предоставляет доступ к текстовым файлам с записями неоднородного размера, такими как последовательности, аннотации, и перекрестно ссылается к наборам данных. Это позволяет вам быстро, и эффективно получите доступ к этим данным, не загружая исходный файл в память.
Этот класс позволяет вам записи индивидуума доступа или подмножество записей, когда исходный файл является слишком большим, чтобы поместиться в память. Можно получить доступ к записям с помощью индексов или ключей. Можно считать и проанализировать одну или несколько записей с помощью обеспеченный интерпретаторы или пользовательскую функцию интерпретатора.
возвращает a BioIFobj
= BioIndexedFile(Format
,SourceFile
)BioIndexedFile
объект BioIFobj
это индексирует содержимое SourceFile
после правил парсинга, заданных Format
, где SourceFile
и Format
задайте имена текстового файла и формата файла, соответственно. Это также создает вспомогательный индексный файл, чтобы хранить информацию, которая предоставляет эффективный, прямой доступ к SourceFile
. Индексный файл по умолчанию хранится в том же месте как исходный файл и имеет то же имя как исходный файл, но с расширением IDX. BioIndexedFile
конструктор использует индексный файл, чтобы создать последующие объекты из SourceFile
, который экономит время.
возвращает a BioIFobj
= BioIndexedFile(Format
,SourceFile
,IndexDir
)BioIndexedFile
объект BioIFobj
путем определения относительного или абсолютного пути к папке, чтобы использовать при поиске или сохранении индексного файла.
возвращает a BioIFobj
= BioIndexedFile(Format
,SourceFile
,IndexFile
)BioIndexedFile
объект BioIFobj
путем определения имени файла, опционально включая относительный или абсолютный путь, чтобы использовать при поиске или сохранении индексного файла.
возвращает a BioIFobj
= BioIndexedFile(___,Name,Value
)BioIndexedFile
объект BioIFobj
при помощи любых входных параметров от предыдущих синтаксисов и дополнительных опций в виде одного или нескольких Name,Value
парные аргументы.
|
Вектор символов или строка, задающая формат файла. Выбор:
Примечание Для всех форматов файлов содержимое файла должно только использовать символы текста ASCII. Символы Non-ASCII не могут быть правильно индексированы. |
|
Вектор символов или строка, задающая имя текстового файла. Это может включать относительный или абсолютный путь. |
|
Вектор символов или строка, задающая относительный или абсолютный путь к папке, чтобы использовать при поиске или сохранении индексного файла. |
|
Вектор символов или строка, задающая имя файла, опционально включая относительный или абсолютный путь, чтобы использовать при поиске или сохранении индексного файла. |
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
|
Задает, можно ли получить доступ к объекту Совет Установите значение к Значение по умолчанию: |
|
Задает, хранит ли конструктор индексы во вспомогательном индексном файле и получает доступ к ним с помощью карт распределения памяти ( Совет Если память не является проблемой, и вы хотите максимизировать эффективность при доступе к записям в объекте, установить значение к
Значение по умолчанию: |
|
Обработайте к функции что Когда Когда |
|
Управляет отображением состояния объектной конструкции. Выбором является Значение по умолчанию: |
Примечание
Следующие аргументы пары "имя-значение" применяются только, когда оба из следующего верны:
Нет никакого существующего ранее индексного файла, сопоставленного с вашим исходным файлом.
Ваш исходный файл имеет формат общего назначения, такой как 'TABLE'
, 'MRTAB'
, или 'FLAT'
.
Для исходных файлов со специализированными форматами предопределены следующие пары "имя-значение", и вы не можете изменить их.
|
Положительное целое число, задающее столбец в Значение по умолчанию: |
|
Вектор символов или строка, которая происходит в каждой записи перед ключом для Значение по умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает линии заголовка в исходном файле так конструктор, игнорируют их при создании объекта. Если значением является Значение по умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает строки с комментариями в исходном файле так конструктор, игнорируют их при создании объекта. Если значением является Значение по умолчанию: |
|
Задает, являются ли записи на непрерывных линиях, что означает, что они не разделяются пустыми линиями или строками с комментариями в исходном файле или нет. Выбором является Совет Установите значение к По умолчанию: false |
|
Вектор символов или строка, задающая символ разделителя, чтобы использовать в качестве разделителя столбцов для Значение по умолчанию: |
|
Вектор символов или строка, задающая символ разделителя, чтобы использовать в качестве диафрагмы записи для Значение по умолчанию: |
|
Формат файла исходного файла Эта информация только для чтения. Возможные значения:
|
|
Могут ли записи в исходном файле быть индексированы алфавитно-цифровым ключом. Эта информация только для чтения. |
|
Путь и имя файла вспомогательного индексного файла. Эта информация только для чтения. Используйте это свойство подтвердить название и местоположение индексного файла, сопоставленного с объектом. |
|
Путь и имя файла исходного файла. Эта информация только для чтения. Используйте это свойство подтвердить название и местоположение исходного файла, из которого был создан объект. |
|
Обработайте к функции, используемой Эта функция интерпретатора должна принять вектор символов одной или нескольких конкатенированных записей и возвратить структуру или массив структур, содержащих интерпретированные данные. Установите это свойство, когда ваш исходный файл будет иметь |
|
Хранятся ли индексы к исходному файлу в файле с отображенной памятью или в памяти. |
|
Количество записей индексируется объектом. Эта информация только для чтения. |
getDictionary | Получите ссылочные имена последовательности из SAM-отформатированного исходного файла, сопоставленного с объектом BioIndexedFile |
getEntryByIndex | Получите записи из исходного файла, сопоставленного с объектом BioIndexedFile с помощью числового индекса |
getEntryByKey | Получите записи из исходного файла, сопоставленного с объектом BioIndexedFile с помощью алфавитно-цифрового ключа |
getIndexByKey | Получите индексы из исходного файла, сопоставленного с объектом BioIndexedFile с помощью алфавитно-цифрового ключа |
getKeys | Получите алфавитно-цифровые ключи из исходного файла, сопоставленного с объектом BioIndexedFile |
getSubset | Создайте объект, содержащий подмножество элементов от объекта BioIndexedFile |
чтение | Считайте одну или несколько записей из исходного файла, сопоставленного с объектом BioIndexedFile |
Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов в MATLAB® Документация Основ программирования.
memmapfile
| fastaread
| fastqread
| samread
| genbankread