Суперклассы:
Быстрый и эффективный доступ к большому текстовому файлу с неуниформными записями
BioIndexedFile класс обеспечивает доступ к текстовым файлам с записями неравномерного размера, такими как последовательности, аннотации и перекрестные ссылки на наборы данных. Он позволяет быстро и эффективно получать доступ к этим данным без загрузки исходного файла в память.
Этот класс позволяет получать доступ к отдельным записям или подмножеству записей, если исходный файл слишком велик для размещения в памяти. Доступ к записям можно получить с помощью индексов или ключей. Можно считывать и анализировать одну или несколько записей с помощью предоставленных интерпретаторов или пользовательской функции интерпретатора.
возвращает BioIFobj = BioIndexedFile(Format,SourceFile)BioIndexedFile объект BioIFobj который индексирует содержимое SourceFile следуя правилам синтаксического анализа, определенным Format, где SourceFile и Format укажите имена текстового файла и формата файла соответственно. Он также создает вспомогательный индексный файл для хранения информации, которая обеспечивает эффективный прямой доступ к SourceFile. Индексный файл по умолчанию хранится в том же месте, что и исходный файл, и имеет то же имя, что и исходный файл, но с расширением IDX. BioIndexedFile конструктор использует индексный файл для создания последующих объектов из SourceFile, что экономит время.
возвращает BioIFobj = BioIndexedFile(Format,SourceFile,IndexDir)BioIndexedFile объект BioIFobj путем указания относительного или абсолютного пути к папке для поиска или сохранения файла индекса.
возвращает BioIFobj = BioIndexedFile(Format,SourceFile,IndexFile)BioIndexedFile объект BioIFobj путем указания имени файла, необязательно включая относительный или абсолютный путь, для использования при поиске или сохранении индексного файла.
возвращает BioIFobj = BioIndexedFile(___,Name,Value)BioIndexedFile объект BioIFobj с использованием любых входных аргументов из предыдущих синтаксисов и дополнительных параметров, указанных как один или несколько Name,Value аргументы пары.
|
Символьный вектор или строка, задающая формат файла. Возможны следующие варианты:
Примечание Для всех форматов файлов содержимое файла должно содержать только текстовые символы ASCII. Символы, не относящиеся к ASCII, могут быть неправильно проиндексированы. |
|
Символьный вектор или строка, указывающая имя текстового файла. Он может включать относительный или абсолютный путь. |
|
Символьный вектор или строка, указывающая относительный или абсолютный путь к папке для поиска или сохранения индексного файла. |
|
Символьный вектор или строка, указывающая имя файла, необязательно включая относительный или абсолютный путь, используемый при поиске или сохранении индексного файла. |
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
|
Указывает, можно ли получить доступ к объекту Совет Задайте значение По умолчанию: |
|
Указывает, сохраняет ли конструктор индексы во вспомогательном индексном файле и обращается ли к ним через карты памяти ( Совет Если память не является проблемой и необходимо повысить производительность при доступе к записям в объекте, установите значение
По умолчанию: |
|
Обращаться к функции, которая Когда Когда |
|
Управление отображением состояния конструкции объекта. Варианты: По умолчанию: |
Примечание
Следующие аргументы пары имя-значение применяются только в том случае, если оба следующих аргумента являются истинными:
С исходным файлом не связан ни один ранее существовавший индексный файл.
Исходный файл имеет формат общего назначения, например: 'TABLE', 'MRTAB', или 'FLAT'.
Для исходных файлов со специфичными для приложения форматами предварительно определены следующие пары «имя-значение», которые невозможно изменить.
|
Положительное целое число, указывающее столбец в По умолчанию: |
|
Символьный вектор или строка, которая встречается в каждой записи перед ключом, для По умолчанию: |
|
Символьный вектор или строка, указывающая префикс, который обозначает строки заголовка в исходном файле, поэтому конструктор игнорирует их при создании объекта. Если значение равно По умолчанию: |
|
Символьный вектор или строка, указывающая префикс, обозначающий строки комментария в исходном файле, поэтому конструктор игнорирует их при создании объекта. Если значение равно По умолчанию: |
|
Указывает, находятся ли записи в смежных строках, что означает, что они не разделены пустыми строками или строками комментария в исходном файле или №. Совет Задайте значение По умолчанию: |
|
Символьный вектор или строка, указывающая символ разделителя для использования в качестве разделителя столбцов По умолчанию: |
|
Символьный вектор или строка, указывающая символ разделителя для использования в качестве разделителя элементов По умолчанию: |
|
Формат исходного файла Эта информация доступна только для чтения. Возможные значения:
|
|
Можно ли индексировать записи в исходном файле буквенно-цифровым ключом. Эта информация доступна только для чтения. |
|
Путь и имя файла дополнительного индексного файла. Эта информация доступна только для чтения. Это свойство используется для подтверждения имени и расположения файла индекса, связанного с объектом. |
|
Путь и имя исходного файла. Эта информация доступна только для чтения. Это свойство используется для подтверждения имени и расположения исходного файла, из которого был создан объект. |
|
Дескриптор функции, используемой Эта функция интерпретатора должна принимать символьный вектор одной или более конкатенированных записей и возвращать структуру или массив структур, содержащих интерпретируемые данные. Установить это свойство, если исходный файл имеет |
|
Хранятся ли индексы исходного файла в файле, сопоставленном с памятью, или в памяти. |
|
Число записей, индексированных объектом. Эта информация доступна только для чтения. |
| getDictionary | Получение имен последовательностей ссылок из исходного файла в формате SAM, связанного с объектом BioIndexedFile |
| getEntryByIndex | Извлечение записей из исходного файла, связанного с объектом BioIndexedFile, с помощью числового индекса |
| getEntryByKey | Извлечение записей из исходного файла, связанного с объектом BioIndexedFile, с помощью буквенно-цифрового ключа |
| getIndexByKey | Извлечение индексов из исходного файла, связанного с объектом BioIndexedFile, с помощью буквенно-цифрового ключа |
| getKeys | Извлечение буквенно-цифровых ключей из исходного файла, связанного с объектом BioIndexedFile |
| getSubset | Создать объект, содержащий подмножество элементов из объекта BioIndexedFile |
| читать | Чтение одной или нескольких записей из исходного файла, связанного с объектом BioIndexedFile |
Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов в документации MATLAB ® Programming Fundamentals.
fastaread | fastqread | genbankread | memmapfile | samread