Суперклассы:
Обеспечьте быстрый и эффективный доступ к большому текстовому файлу с записями неоднородного размера
BioIndexedFile
класс позволяет обращаться к текстовым файлам с неоднородными по размеру записями, такими как последовательности, аннотации и перекрестные ссылки на наборы данных. Он позволяет быстро и эффективно получить доступ к этим данным, не загружая исходный файл в память.
Этот класс позволяет вам получить доступ к отдельным записям или подмножеству записей, когда исходный файл слишком велик, чтобы помещаться в память. Вы можете получить доступ к записям с помощью индексов или ключей. Вы можете считать и анализировать одну или несколько записей с помощью предоставленных интерпретаторов или пользовательской функции интерпретатора.
возвращает a BioIFobj
= BioIndexedFile(Format
,SourceFile
)BioIndexedFile
BioIFobj объекта
который индексирует содержимое SourceFile
следуя правилам разбора, заданным как Format
, где SourceFile
и Format
задайте имена текстового файла и формата файла, соответственно. Он также создает вспомогательный индексный файл для хранения информации, которая позволяет эффективный, прямой доступ к SourceFile
. Файл индекса по умолчанию хранится в том же месте, что и исходный файл, и имеет то же имя, что и исходный файл, но с расширением IDX. BioIndexedFile
конструктор использует файл индекса, чтобы создать последующие объекты из SourceFile
, что экономит время.
возвращает a BioIFobj
= BioIndexedFile(Format
,SourceFile
,IndexDir
)BioIndexedFile
BioIFobj объекта
путем определения относительного или абсолютного пути к папке, которая будет использоваться при поиске или сохранении файла индекса.
возвращает a BioIFobj
= BioIndexedFile(Format
,SourceFile
,IndexFile
)BioIndexedFile
BioIFobj объекта
путем определения имени файла, опционально включая относительный или абсолютный путь, который будет использоваться при поиске или сохранении файла индекса.
возвращает a BioIFobj
= BioIndexedFile(___,Name,Value
)BioIndexedFile
BioIFobj объекта
при помощи любых входных параметров из предыдущих синтаксисов и дополнительных опций, заданных как один или несколько Name,Value
аргументы в виде пар.
|
Вектор символов или строка, задающая формат файла. Варианты:
Примечание Для всех форматов файлов в содержимом файла должны использоваться только текстовые символы ASCII. Символы, отличные от ASCII, могут быть неправильно индексированы. |
|
Вектор символов или строка, задающая имя текстового файла. Он может включать относительный или абсолютный путь. |
|
Вектор символов или строка, задающая относительный или абсолютный путь к папке, которая будет использоваться при поиске или сохранении файла индекса. |
|
Вектор символов или строка, задающая имя файла, опционально включая относительный или абсолютный путь, используемый при поиске или сохранении файла индекса. |
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
|
Определяет, можно ли получить доступ к объекту Совет Установите значение равным По умолчанию: |
|
Определяет, хранит ли конструктор индексы во вспомогательном индексном файле и обращается ли к ним через карты памяти ( Совет Если память не является проблемой, и вы хотите максимизировать эффективность при доступе к записям в объекте, задайте значение
По умолчанию: |
|
Указатель на функцию, которая Когда Когда |
|
Управление отображением статуса конструкции объекта. Варианты По умолчанию: |
Примечание
Следующие аргументы пары "имя-значение" применяются только в том случае, когда оба из следующих аргументов равны true:
Ранее существующий индексный файл, сопоставленный с исходным файлом, отсутствует.
Ваш исходный файл имеет общий формат, такой как 'TABLE'
, 'MRTAB'
, или 'FLAT'
.
Для исходных файлов с форматами конкретного приложения предварительно заданы следующие пары "имя-значение", и вы не можете их изменить.
|
Положительное целое число, указывающее столбец в По умолчанию: |
|
Вектор символов, которая возникает в каждой записи перед ключом, для По умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает линии заголовка в исходном файле, поэтому конструктор игнорирует их при создании объекта. Если значение По умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает строки с комментариями в исходном файле, поэтому конструктор игнорирует их при создании объекта. Если значение По умолчанию: |
|
Указывает, находятся ли записи в смежных линиях, что означает, что они не разделяются пустыми линиями или строками с комментариями, в исходном файле или без Совет Установите значение равным По умолчанию: |
|
Вектор символов или строка, задающая символ разделителя для использования в качестве диафрагмы столбцов для По умолчанию: |
|
Вектор символов или строка, задающая символ разделителя для использования в качестве диафрагмы записей для По умолчанию: |
|
Формат файла исходного файла Эта информация доступна только для чтения. Возможные значения:
|
|
Можно ли индексировать записи в исходном файле алфавитно-цифровым ключом. Эта информация доступна только для чтения. |
|
Путь и имя файла вспомогательного файла индекса. Эта информация доступна только для чтения. Используйте это свойство для подтверждения имени и местоположения файла индекса, связанного с объектом. |
|
Путь и имя файла исходного файла. Эта информация доступна только для чтения. Используйте это свойство для подтверждения имени и местоположения исходного файла, из которого был создан объект. |
|
Указатель на функцию, используемую Эта функция интерпретатора должна принять вектор символов одной или нескольких конкатенированных записей и вернуть структуру или массив структур, содержащих интерпретированные данные. Установите это свойство, когда ваш исходный файл имеет |
|
Сохраняются ли индексы к исходному файлу в файле, сопоставленном с памятью, или в памяти. |
|
Количество записей, индексированных объектом. Эта информация доступна только для чтения. |
getDictionary | Получите имена ссылочных последовательностей из исходного файла в формате SAM, связанного с объектом BioIndexedFile |
getEntryByIndex | Извлечение записей из исходного файла, сопоставленного с объектом BioIndexedFile, с помощью числового индекса |
getEntryByKey | Извлечение записей из исходного файла, сопоставленного с объектом BioIndexedFile, с помощью алфавитно-цифрового ключа |
getIndexByKey | Извлечение индексов из исходного файла, сопоставленного с объектом BioIndexedFile, с помощью алфавитно-цифрового ключа |
getKeys | Извлечение алфавитно-цифровых ключей из исходного файла, связанного с объектом BioIndexedFile |
getSubset | Создайте объект, содержащий подмножество элементов из объекта BioIndexedFile |
читать | Чтение одной или нескольких записей из исходного файла, связанного с объектом BioIndexedFile |
Значение. Чтобы узнать, как классы значений влияют на операции копирования, смотрите Копирование объектов в MATLAB® Документация по основам программирования.
fastaread
| fastqread
| genbankread
| memmapfile
| samread