Суперклассы:
Обеспечьте быстрый и эффективный доступ к большому текстовому файлу с записями неоднородного размера
BioIndexedFile класс позволяет обращаться к текстовым файлам с неоднородными по размеру записями, такими как последовательности, аннотации и перекрестные ссылки на наборы данных. Он позволяет быстро и эффективно получить доступ к этим данным, не загружая исходный файл в память.
Этот класс позволяет вам получить доступ к отдельным записям или подмножеству записей, когда исходный файл слишком велик, чтобы помещаться в память. Вы можете получить доступ к записям с помощью индексов или ключей. Вы можете считать и анализировать одну или несколько записей с помощью предоставленных интерпретаторов или пользовательской функции интерпретатора.
возвращает a BioIFobj = BioIndexedFile(Format,SourceFile)BioIndexedFile BioIFobj объекта который индексирует содержимое SourceFile следуя правилам разбора, заданным как Format, где SourceFile и Format задайте имена текстового файла и формата файла, соответственно. Он также создает вспомогательный индексный файл для хранения информации, которая позволяет эффективный, прямой доступ к SourceFile. Файл индекса по умолчанию хранится в том же месте, что и исходный файл, и имеет то же имя, что и исходный файл, но с расширением IDX. BioIndexedFile конструктор использует файл индекса, чтобы создать последующие объекты из SourceFile, что экономит время.
возвращает a BioIFobj = BioIndexedFile(Format,SourceFile,IndexDir)BioIndexedFile BioIFobj объекта путем определения относительного или абсолютного пути к папке, которая будет использоваться при поиске или сохранении файла индекса.
возвращает a BioIFobj = BioIndexedFile(Format,SourceFile,IndexFile)BioIndexedFile BioIFobj объекта путем определения имени файла, опционально включая относительный или абсолютный путь, который будет использоваться при поиске или сохранении файла индекса.
возвращает a BioIFobj = BioIndexedFile(___,Name,Value)BioIndexedFile BioIFobj объекта при помощи любых входных параметров из предыдущих синтаксисов и дополнительных опций, заданных как один или несколько Name,Value аргументы в виде пар.
|
Вектор символов или строка, задающая формат файла. Варианты:
Примечание Для всех форматов файлов в содержимом файла должны использоваться только текстовые символы ASCII. Символы, отличные от ASCII, могут быть неправильно индексированы. |
|
Вектор символов или строка, задающая имя текстового файла. Он может включать относительный или абсолютный путь. |
|
Вектор символов или строка, задающая относительный или абсолютный путь к папке, которая будет использоваться при поиске или сохранении файла индекса. |
|
Вектор символов или строка, задающая имя файла, опционально включая относительный или абсолютный путь, используемый при поиске или сохранении файла индекса. |
Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.
|
Определяет, можно ли получить доступ к объекту Совет Установите значение равным По умолчанию: |
|
Определяет, хранит ли конструктор индексы во вспомогательном индексном файле и обращается ли к ним через карты памяти ( Совет Если память не является проблемой, и вы хотите максимизировать эффективность при доступе к записям в объекте, задайте значение
По умолчанию: |
|
Указатель на функцию, которая Когда Когда |
|
Управление отображением статуса конструкции объекта. Варианты По умолчанию: |
Примечание
Следующие аргументы пары "имя-значение" применяются только в том случае, когда оба из следующих аргументов равны true:
Ранее существующий индексный файл, сопоставленный с исходным файлом, отсутствует.
Ваш исходный файл имеет общий формат, такой как 'TABLE', 'MRTAB', или 'FLAT'.
Для исходных файлов с форматами конкретного приложения предварительно заданы следующие пары "имя-значение", и вы не можете их изменить.
|
Положительное целое число, указывающее столбец в По умолчанию: |
|
Вектор символов, которая возникает в каждой записи перед ключом, для По умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает линии заголовка в исходном файле, поэтому конструктор игнорирует их при создании объекта. Если значение По умолчанию: |
|
Вектор символов или строка, задающая префикс, который обозначает строки с комментариями в исходном файле, поэтому конструктор игнорирует их при создании объекта. Если значение По умолчанию: |
|
Указывает, находятся ли записи в смежных линиях, что означает, что они не разделяются пустыми линиями или строками с комментариями, в исходном файле или без Совет Установите значение равным По умолчанию: |
|
Вектор символов или строка, задающая символ разделителя для использования в качестве диафрагмы столбцов для По умолчанию: |
|
Вектор символов или строка, задающая символ разделителя для использования в качестве диафрагмы записей для По умолчанию: |
|
Формат файла исходного файла Эта информация доступна только для чтения. Возможные значения:
|
|
Можно ли индексировать записи в исходном файле алфавитно-цифровым ключом. Эта информация доступна только для чтения. |
|
Путь и имя файла вспомогательного файла индекса. Эта информация доступна только для чтения. Используйте это свойство для подтверждения имени и местоположения файла индекса, связанного с объектом. |
|
Путь и имя файла исходного файла. Эта информация доступна только для чтения. Используйте это свойство для подтверждения имени и местоположения исходного файла, из которого был создан объект. |
|
Указатель на функцию, используемую Эта функция интерпретатора должна принять вектор символов одной или нескольких конкатенированных записей и вернуть структуру или массив структур, содержащих интерпретированные данные. Установите это свойство, когда ваш исходный файл имеет |
|
Сохраняются ли индексы к исходному файлу в файле, сопоставленном с памятью, или в памяти. |
|
Количество записей, индексированных объектом. Эта информация доступна только для чтения. |
| getDictionary | Получите имена ссылочных последовательностей из исходного файла в формате SAM, связанного с объектом BioIndexedFile |
| getEntryByIndex | Извлечение записей из исходного файла, сопоставленного с объектом BioIndexedFile, с помощью числового индекса |
| getEntryByKey | Извлечение записей из исходного файла, сопоставленного с объектом BioIndexedFile, с помощью алфавитно-цифрового ключа |
| getIndexByKey | Извлечение индексов из исходного файла, сопоставленного с объектом BioIndexedFile, с помощью алфавитно-цифрового ключа |
| getKeys | Извлечение алфавитно-цифровых ключей из исходного файла, связанного с объектом BioIndexedFile |
| getSubset | Создайте объект, содержащий подмножество элементов из объекта BioIndexedFile |
| читать | Чтение одной или нескольких записей из исходного файла, связанного с объектом BioIndexedFile |
Значение. Чтобы узнать, как классы значений влияют на операции копирования, смотрите Копирование объектов в MATLAB® Документация по основам программирования.
fastaread | fastqread | genbankread | memmapfile | samread