Суперклассы: BioRead
Содержат данные о последовательности, качестве, выравнивании и сопоставлении
BioMap класс содержит данные из коротких считанных последовательностей, включая заголовки последовательностей, считанные последовательности, оценки качества для последовательностей и данные о том, как каждая последовательность выравнивается по заданной ссылке. Эти данные обычно получают из высокопроизводительного прибора секвенирования.
Построить BioMap объект из данных последовательности с коротким чтением. Каждый элемент объекта имеет связанную с ним последовательность, заголовок, оценку качества и информацию выравнивания/сопоставления. Используйте свойства и методы объекта для просмотра, доступа, фильтрации и управления всеми или подмножеством данных перед анализом или просмотром данных.
конструкции BioMapobj = BioMapBioMapobj, который является пустым BioMap объект.
конструкции BioMapobj = BioMap(File)BioMapobj, a BioMap объект, из File, файл в формате SAM или BAM, чтение которого упорядочено по начальной позиции в ссылочной последовательности. Данные остаются в исходном файле, и BioMap объект обращается к нему с помощью одного или двух вспомогательных индексных файлов. Для файла в формате SAM MATLAB ® использует или создает один индексный файл, который должен иметь то же имя, что и исходный файл, но с .idx расширение. Для файла в формате BAM MATLAB использует или создает два индексных файла, которые должны иметь то же имя, что и исходный файл, но с *.bai и *.linearindex расширения. Если файлы индекса не находятся в той же папке, что и исходный файл, BioMap функция конструктора создает индексные файлы в этой папке.
При передаче неупорядоченного файла в формате BAM конструктор автоматически упорядочивает файл и записывает данные в упорядоченный файл, используя то же самое базовое имя и расширение с добавленным символьным вектором. «ordered» перед расширением. Новый файл индексируется и используется для создания экземпляра нового BioMap объект.
Примечание
Поскольку данные остаются в исходном файле и доступны с помощью индексных файлов:
Не удаляйте исходный файл (SAM или BAM).
Не удаляйте файлы индекса (*.idx,*.bai, или *.linearindex).
Изменение невозможно BioMapobj свойства.
Совет
Чтобы определить количество последовательностей ссылок, включенных в исходный файл, используйте saminfo или baminfo функция. Используйте SAMtools, чтобы проверить, упорядочены ли чтения в исходном файле по положению в ссылочной последовательности, а также, при необходимости, переупорядочить их.
конструкции BioMapobj = BioMap(Struct)BioMapobj, a BioMap объект, из Struct, структура MATLAB, содержащая информацию о последовательности и выравнивании, такую как возвращенная samread или bamread функция. Данные из Struct остается в памяти, что позволяет изменить BioMapobj свойства.
создает BioMapobj = BioMap(___,'Name',Value)BioMap с использованием любого из предыдущих входных аргументов и дополнительных параметров, указанных в качестве аргументов пары имя-значение следующим образом.
выбирает одну или несколько ссылок, когда исходные данные содержат последовательности, сопоставленные с несколькими ссылками. По умолчанию конструктор включает все ссылки в словарь заголовка исходного файла. Если словарь заголовка недоступен, конструктор по умолчанию включает все имена ссылок, найденные в исходных данных. BioMapobj = BioMap(___,'SelectReference',SelectRefValue)SelectRefValue - символьный вектор, строка, строковый вектор или массив ячеек символьных векторов. С помощью этой опции можно предотвратить BioMap из создания вспомогательных индексных файлов для ссылок, которые не будут использоваться в анализе. Если какие-либо чтения, сопоставленные с выбранными привязками, являются парными и BioMapobj записывается в файл, последовательности ссылок пар также включаются в заголовок файла.
указывает, следует ли поместить данные в память или оставить данные в исходном файле. Сохранение данных в исходном файле и доступ через индексный файл является более эффективным с точки зрения памяти, но не позволяет изменять свойства BioMapobj = BioMap(File,'InMemory',InMemoryValue)BioMapobj. Варианты: true или false (по умолчанию). Если первый входной аргумент не является именем файла, то этот аргумент пары имя-значение игнорируется, и данные автоматически помещаются в память.
Совет
Установите 'InMemory' аргумент пары имя-значение для true если вы хотите изменить свойства BioMapobj.
указывает путь к папке, в которой находятся индексные файлы (*.BioMapobj = BioMap(___,'IndexDir',IndexDirValue)idx,*.bai, или *.linearindex) либо существуют, либо будут созданы.
Совет
Используйте 'IndexDir' аргумент пары имя-значение, если у вас нет доступа на запись к папке, в которой находится исходный файл.
конструкции BioMapobj = BioMap(___,'Sequence',SequenceValue)BioMapobj, a BioMap объект, из SequenceValue который содержит буквенные представления нуклеотидных последовательностей. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'Header',HeaderValue)BioMapobj, a BioMap объект, из HeaderValue который содержит текст заголовка для нуклеотидных последовательностей. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'Quality',QualityValue)BioMapobj, a BioMap объект, из QualityValue который содержит ASCII представление показателей качества по основаниям для нуклеотидных последовательностей. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'Reference',ReferenceValue)BioMapobj, a BioMap и устанавливает Reference свойство для ReferenceValue содержит имена ссылочных последовательностей. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'Signature',SignatureValue)BioMapobj, a BioMap объект, из SignatureValue который содержит информацию, описывающую выравнивание каждой считанной последовательности с ссылочной последовательностью. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'Start',StartValue)BioMapobj, a BioMap объект, из StartValueвектор положительных целых чисел, задающий положение в опорной последовательности, где начинается выравнивание каждой считанной последовательности. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'Flag',FlagValue)BioMapobj, a BioMap объект, из FlagValueвектор положительных целых чисел, указывающий битовую информацию для состояния 11 флагов, заданных спецификацией формата SAM. Эти флаги описывают различные аспекты последовательности и выравнивания последовательностей считывания. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'MappingQuality',MappingQualityValue)BioMapobj, a BioMap объект, из MappingQualityValueвектор положительных целых чисел, задающий качество отображения для каждой считанной последовательности. Эта пара имя-значение работает только в том случае, если данные считываются в память.
конструкции BioMapobj = BioMap(___,'MatePosition',MatePositionValue)BioMapobj, a BioMap объект, из MatePositionValueвектор неотрицательных целых чисел, задающий положение совмещения для каждой считываемой последовательности. Эта пара имя-значение работает только в том случае, если данные считываются в память.
|
Символьный вектор или строка, задающая файл в формате SAM или BAM, который содержит только одну последовательность ссылок и чтение которого упорядочено по начальной позиции в последовательности ссылок. |
|
Структура MATLAB, содержащая информацию о последовательности и выравнивании, например, |
|
Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих имя ссылочных последовательностей в |
|
Логическое указание, следует ли поместить данные в память или оставить данные в исходном файле. Сохранение данных в исходном файле и доступ к ним через индексный файл обеспечивает большую эффективность памяти, но не позволяет изменять свойства По умолчанию: |
|
Символьный вектор или строка, указывающая путь к папке, в которой существует или будет создан индексный файл. По умолчанию: Папка, где |
|
Строковый вектор или клеточный массив символьных векторов, содержащих буквенные представления нуклеотидных последовательностей. Эта информация заполняет |
|
Строковый вектор или клеточный массив символьных векторов, содержащих ASCII представление показателей качества по основаниям для нуклеотидных последовательностей. Эта информация заполняет |
|
Строковый вектор или клеточный массив символьных векторов, содержащих текст заголовка для нуклеотидных последовательностей. Эта информация заполняет |
|
Символьный вектор или строка, описывающая По умолчанию: |
|
Строковый вектор или массив ячеек символьных векторов, содержащих имена ссылочных последовательностей. Эта информация заполняет объект |
|
Строковый вектор или массив ячеек символьных векторов, содержащих информацию, описывающую выравнивание каждой считанной последовательности с эталонной последовательностью. |
|
Вектор положительных целых чисел, указывающий положение в ссылочной последовательности, где начинается выравнивание каждой считываемой последовательности. Эта информация заполняет объект |
|
Вектор положительных целых чисел, указывающий битовую информацию о состоянии 11 флагов, указанных в спецификации формата SAM. Эти флаги описывают различные аспекты последовательности и выравнивания последовательностей считывания. Эта информация заполняет объект |
|
Вектор положительных целых чисел, задающий качество отображения для каждой считанной последовательности. Эта информация заполняет объект |
|
Вектор неотрицательных целых чисел, задающий положение совмещения для каждой считываемой последовательности. Эта информация заполняет объект |
|
Флаги, связанные со всеми последовательностями чтения, представленными в Вектор положительных целых чисел, так что существует целое число для каждой считанной последовательности в объекте. Каждое целое число указывает битовую информацию, которая указывает состояние 11 флагов, описанных в спецификации формата SAM. Эти флаги описывают различные аспекты последовательности и выравнивания последовательности считывания. Существует взаимосвязь «один к одному» между числом и порядком элементов в |
|
Заголовки, связанные со всеми последовательностями чтения, представленными в Массив ячеек символьных векторов, так что имеется заголовок для каждой считываемой последовательности в объекте. Заголовки могут быть пустыми. Существует взаимосвязь «один к одному» между числом и порядком элементов в |
|
Положения пар для всех последовательностей считывания, представленных в Вектор неотрицательных целых чисел, так что существует целое число для каждой считанной последовательности в объекте. Каждое целое число указывает положение соответствующей последовательности совмещения относительно эталонной последовательности. Существует взаимосвязь «один к одному» между числом и порядком элементов в Не все значения в |
|
Отображение показателей качества, связанных со всеми последовательностями чтения, представленными в Вектор целых чисел, так что существует оценка качества отображения для каждой считанной последовательности в объекте. Существует взаимосвязь «один к одному» между числом и порядком элементов в |
|
Описание Символьный вектор, описывающий По умолчанию: |
|
Количество последовательностей в Эта информация доступна только для чтения. |
|
Оценки качества на базу, связанные со всеми последовательностями чтения, представленными в Массив ячеек символьных векторов, так что существует качество для каждой считываемой последовательности в объекте. Каждое качество представляет собой ASCII-представление показателей качества на базу для последовательности считывания. Качество может быть пустым символьным вектором. Существует взаимосвязь «один к одному» между числом и порядком элементов в |
|
Ссылочные последовательности в
Эталонные последовательности представляют собой последовательности, по которым выровнены считанные последовательности. |
|
Считывание последовательностей в Массив ячеек символьных векторов, содержащих буквенные представления считанных последовательностей. |
|
Массив ячеек векторов символов, который каталогизирует имена ссылок, доступных в Эта информация доступна только для чтения. |
|
Информация о выравнивании, связанная со всеми последовательностями чтения, представленными в Массив ячеек векторов символов в формате CIGAR, так что имеется информация выравнивания для каждой считанной последовательности в объекте. Каждый символьный вектор представляет, как последовательность считывания выравнивается по ссылочной последовательности. Подписи могут быть пустыми векторами символов. Существует взаимосвязь «один к одному» между числом и порядком элементов в |
|
Начальные позиции всех выровненных последовательностей чтения, представленных в Вектор целых чисел, так что имеется начальная позиция для каждой считанной последовательности в объекте. Каждое целое число определяет начальную позицию выровненной последовательности считывания относительно номеров позиций в ссылочной последовательности. Существует взаимосвязь «один к одному» между числом и порядком элементов в |
| filterByFlag | Последовательность фильтров, считываемая флагом SAM |
| getAlignment | Построение трассы, представленной в BioMap объект |
| getBaseCoverage | Возврат покрытия базовой выставки ссылочной последовательности в BioMap объект |
| getCompactAlignment | Построение компактной трассы, представленной в BioMap объект |
| getCounts | Возвращаемое число считанных последовательностей, выровненных по ссылочной последовательности в BioMap объект |
| getFlag | Извлечь флаги последовательности чтения из BioMap объект |
| getIndex | Возвращаемые индексы последовательностей считывания, выровненных по ссылочной последовательности в BioMap объект |
| getInfo | Получение информации для одного элемента BioMap объект |
| getMappingQuality | Получение показателей качества отображения последовательности из BioMap объект |
| getMatePosition | Извлекать положения совмещения последовательностей чтения из BioMap объект |
| getReference | Получение ссылочной последовательности из BioMap объект |
| getSignature | Получение подписи (информации о выравнивании) из BioMap объект |
| getStart | Получение начальных позиций выровненных последовательностей чтения из BioMap объект |
| getStop | Вычислить стоп-позиции выровненных последовательностей чтения из BioMap объект |
| getSummary | Печать сводки BioMap объект |
| setFlag | Установка флагов последовательности чтения для BioMap объект |
| setMappingQuality | Установка показателей качества отображения последовательности для BioMap объект |
| setMatePosition | Задать положения совмещения последовательностей чтения в BioMap объект |
| setReference | Задать имя ссылочной последовательности для BioMap объект |
| setSignature | Установить сигнатуру (информацию об трассе) для BioMap объект |
| setStart | Установка начальных позиций выровненных последовательностей чтения в BioMap объект |
| объединиться | Объединение двух объектов |
| добраться | Получить свойство объекта |
| getHeader | Извлечение заголовков последовательности из объекта |
| getQuality | Получение информации о качестве последовательности из объекта |
| getSequence | Извлечение последовательностей из объекта |
| getSubsequence | Извлечение частичных последовательностей из объекта |
| getSubset | Извлечение подмножества элементов из объекта |
| набор | Задать свойство объекта |
| setHeader | Обновить информацию заголовка для операций чтения |
| setQuality | Обновление информации о качестве |
| setSequence | Обновить последовательности чтения |
| setSubsequence | Обновить частичные последовательности |
| setSubset | Обновить элементы объекта |
| написать | Запись содержимого объекта BioRead или BioMap в файл |
Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов в документации по основам программирования MATLAB.
BioMap объекты поддерживают точку. индексирование для извлечения, назначения и удаления данных.
align2cigar | bamindexread | baminfo | bamread | BioIndexedFile | BioRead | cigar2align | saminfo | samread