Суперклассы:
Предоставьте быстрый и эффективный доступ к файлу крупного текста с записями неоднородного размера
BioIndexedFile класс предоставляет доступ к текстовым файлам с записями неоднородного размера, такими как последовательности, аннотации, и перекрестно ссылается к наборам данных. Это позволяет вам быстро, и эффективно получите доступ к этим данным, не загружая исходный файл в память.
Этот класс позволяет вам записи индивидуума доступа или подмножество записей, когда исходный файл является слишком большим, чтобы поместиться в память. Можно получить доступ к записям с помощью индексов или ключей. Можно считать и проанализировать одну или несколько записей с помощью обеспеченный интерпретаторы или пользовательскую функцию интерпретатора.
возвращает a BioIFobj = BioIndexedFile(Format,SourceFile)BioIndexedFile объект BioIFobj это индексирует содержимое SourceFile после правил парсинга, заданных Format, где SourceFile и Format задайте имена текстового файла и формата файла, соответственно. Это также создает вспомогательный индексный файл, чтобы хранить информацию, которая предоставляет эффективный, прямой доступ к SourceFile. Индексный файл по умолчанию хранится в том же месте как исходный файл и имеет то же имя как исходный файл, но с расширением IDX. BioIndexedFile конструктор использует индексный файл, чтобы создать последующие объекты из SourceFile, который экономит время.
возвращает a BioIFobj = BioIndexedFile(Format,SourceFile,IndexDir)BioIndexedFile объект BioIFobj путем определения относительного или абсолютного пути к папке, чтобы использовать при поиске или сохранении индексного файла.
возвращает a BioIFobj = BioIndexedFile(Format,SourceFile,IndexFile)BioIndexedFile объект BioIFobj путем определения имени файла, опционально включая относительный или абсолютный путь, чтобы использовать при поиске или сохранении индексного файла.
возвращает a BioIFobj = BioIndexedFile(___,Name,Value)BioIndexedFile объект BioIFobj при помощи любых входных параметров от предыдущих синтаксисов и дополнительных опций в виде одного или нескольких Name,Value парные аргументы.
|
Вектор символов или строка, задающая формат файла. Выбор:
Примечание Для всех форматов файлов содержимое файла должно только использовать символы текста ASCII. Символы Non-ASCII не могут быть правильно индексированы. |
|
Вектор символов или строка, задающая имя текстового файла. Это может включать относительный или абсолютный путь. |
|
Вектор символов или строка, задающая относительный или абсолютный путь к папке, чтобы использовать при поиске или сохранении индексного файла. |
|
Вектор символов или строка, задающая имя файла, опционально включая относительный или абсолютный путь, чтобы использовать при поиске или сохранении индексного файла. |
Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.
|
Задает, можно ли получить доступ к объекту Совет Установите значение к Значение по умолчанию: |
|
Задает, хранит ли конструктор индексы во вспомогательном индексном файле и получает доступ к ним с помощью карт распределения памяти ( Совет Если память не является проблемой, и вы хотите максимизировать эффективность при доступе к записям в объекте, установить значение к
Значение по умолчанию: |
|
Обработайте к функции что Когда Когда |
|
Управляет отображением состояния объектной конструкции. Выбором является Значение по умолчанию: |
Примечание
Следующие аргументы пары "имя-значение" применяются только, когда оба из следующего верны:
Нет никакого существующего ранее индексного файла, сопоставленного с вашим исходным файлом.
Ваш исходный файл имеет формат общего назначения, такой как 'TABLE', 'MRTAB', или 'FLAT'.
Для исходных файлов со специализированными форматами предопределены следующие пары "имя-значение", и вы не можете изменить их.
|
Положительное целое число, задающее столбец в Значение по умолчанию: |
|
Вектор символов или строка, которая происходит в каждой записи перед ключом для Значение по умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает линии заголовка в исходном файле так конструктор, игнорируют их при создании объекта. Если значением является Значение по умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает строки с комментариями в исходном файле так конструктор, игнорируют их при создании объекта. Если значением является Значение по умолчанию: |
|
Задает, являются ли записи на непрерывных линиях, что означает, что они не разделяются пустыми линиями или строками с комментариями в исходном файле или нет. Выбором является Совет Установите значение к По умолчанию: false |
|
Вектор символов или строка, задающая символ разделителя, чтобы использовать в качестве разделителя столбцов для Значение по умолчанию: |
|
Вектор символов или строка, задающая символ разделителя, чтобы использовать в качестве диафрагмы записи для Значение по умолчанию: |
|
Формат файла исходного файла Эта информация только для чтения. Возможные значения:
|
|
Могут ли записи в исходном файле быть индексированы алфавитно-цифровым ключом. Эта информация только для чтения. |
|
Путь и имя файла вспомогательного индексного файла. Эта информация только для чтения. Используйте это свойство подтвердить название и местоположение индексного файла, сопоставленного с объектом. |
|
Путь и имя файла исходного файла. Эта информация только для чтения. Используйте это свойство подтвердить название и местоположение исходного файла, из которого был создан объект. |
|
Обработайте к функции, используемой Эта функция интерпретатора должна принять вектор символов одной или нескольких конкатенированных записей и возвратить структуру или массив структур, содержащих интерпретированные данные. Установите это свойство, когда ваш исходный файл будет иметь |
|
Хранятся ли индексы к исходному файлу в файле с отображенной памятью или в памяти. |
|
Количество записей индексируется объектом. Эта информация только для чтения. |
| getDictionary | Получите ссылочные имена последовательности из SAM-отформатированного исходного файла, сопоставленного с объектом BioIndexedFile |
| getEntryByIndex | Получите записи из исходного файла, сопоставленного с объектом BioIndexedFile с помощью числового индекса |
| getEntryByKey | Получите записи из исходного файла, сопоставленного с объектом BioIndexedFile с помощью алфавитно-цифрового ключа |
| getIndexByKey | Получите индексы из исходного файла, сопоставленного с объектом BioIndexedFile с помощью алфавитно-цифрового ключа |
| getKeys | Получите алфавитно-цифровые ключи из исходного файла, сопоставленного с объектом BioIndexedFile |
| getSubset | Создайте объект, содержащий подмножество элементов от объекта BioIndexedFile |
| чтение | Считайте одну или несколько записей из исходного файла, сопоставленного с объектом BioIndexedFile |
Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов в документации MATLAB® Programming Fundamentals.
fastaread | fastqread | genbankread | memmapfile | samread