Суперклассы: BioRead
Содержите последовательность, качество, выравнивание и данные об отображении
BioMap
класс содержит данные из последовательностей короткого чтения, включая заголовки последовательности, считайте последовательности, качественную музыку к последовательностям и данные о том, как каждая последовательность выравнивается к данной ссылке. Эти данные обычно получаются из высокопроизводительного инструмента секвенирования.
Создайте a BioMap
объект из данных о последовательности короткого чтения. Каждый элемент в объекте имеет последовательность, заголовок, качественный счет и информацию о выравнивании/отображении, сопоставленную с ним. Используйте свойства объектов и методы, чтобы исследовать, получить доступ, отфильтровать, и управлять всеми или подмножеством данных, прежде, чем анализировать или просмотреть данные.
построения BioMapobj
= BioMapBioMapobj
, который является пустым BioMap
объект.
построения BioMapobj
= BioMap(File
)BioMapobj
A BioMap
объект, от File
, SAM-или отформатированный BAM файл, чтения которого упорядочены положением запуска в ссылочной последовательности. Данные остаются в исходном файле, и BioMap
доступы к объекту это с помощью одного или двух вспомогательных индексных файлов. Для SAM-отформатированного файла, MATLAB® использование или создает один индексный файл, который должен иметь то же имя как исходный файл, но с .idx
расширение. Для отформатированного BAM файла MATLAB использует или создает два индексных файла, которые должны иметь то же имя как исходный файл, но с *.bai
и *.linearindex
расширения. Если индексные файлы не найдены в той же папке как исходный файл, BioMap
функция конструктора создает индексные файлы в той папке.
Когда вы передаете в неупорядоченном отформатированном BAM файле, конструктор автоматически заказывает файл и пишет данные в упорядоченный файл с помощью того же базового имени и расширения с добавленным вектором символов “.ordered” перед расширением. Новый файл индексируется и используется, чтобы инстанцировать нового BioMap
объект.
Примечание
Поскольку данные остаются в исходном файле и получены доступ с помощью индексных файлов:
Не удаляйте исходный файл (SAM или BAM).
Не удаляйте индексные файлы (*.idx
, *.bai
, или *.linearindex
).
Вы не можете изменить BioMapobj
свойства.
Совет
Чтобы определить количество ссылочных последовательностей, включенных в ваш исходный файл, используйте saminfo
или baminfo
функция. Используйте SAMtools, чтобы проверять, упорядочены ли чтения в вашем исходном файле положением в ссылочной последовательности, и также переупорядочить их, в случае необходимости.
построения BioMapobj
= BioMap(Struct
)BioMapobj
A BioMap
объект, от Struct
, структура MATLAB, содержащая последовательность и информацию о выравнивании, такой, как возвращено samread
или bamread
функция. Данные из Struct
остается в памяти, которая позволяет вам изменить BioMapobj
свойства.
создает BioMapobj
= BioMap(___,'Name
',Value
)BioMap
объект с помощью любого из предыдущих входных параметров и дополнительных опций в виде аргументов пары "имя-значение" можно следующим образом.
выбирает одну или несколько ссылок, когда исходные данные содержат последовательности, сопоставленные больше чем с одной ссылкой. По умолчанию конструктор включает все ссылки в словаре заголовка исходного файла. Когда словарь заголовка не доступен, значения по умолчанию конструктора к включению всех ссылочных имен, найденных в исходных данных. BioMapobj
= BioMap(___,'SelectReference'
,SelectRefValue
)SelectRefValue
вектор символов, строка, вектор строки или массив ячеек из символьных векторов. При помощи этой опции можно предотвратить BioMap
конструктор от создания вспомогательных индексных файлов для ссылок, которые вы не будете использовать в своем анализе. Если какие-либо чтения, сопоставленные с выбранными ссылками, соединяются и BioMapobj
записан в файл, ссылочные последовательности помощников также включены в заголовок файла.
задает, поместить ли данные в память или оставить данные в исходном файле. Отъезд данных в исходном файле и доступ через индексный файл используют память более эффективно, но не позволяют вам изменить свойства BioMapobj
= BioMap(File
,'InMemory'
,InMemoryValue
)BioMapobj
. Выбором является true
или false
(значение по умолчанию). Если первый входной параметр не является именем файла, то этот аргумент пары "имя-значение" проигнорирован, и данные автоматически помещаются в память.
Совет
Установите 'InMemory'
аргумент пары "имя-значение" true
если вы хотите изменить свойства BioMapobj
.
задает путь к папке где индексные файлы (*.BioMapobj
= BioMap(___,'IndexDir'
,IndexDirValue
)idx
, *.bai
, или *.linearindex
) или существуйте, или будет создан.
Совет
Используйте 'IndexDir'
аргумент пары "имя-значение", если у вас нет доступа для записи к папке, где исходный файл расположен.
построения BioMapobj
= BioMap(___,'Sequence'
,SequenceValue
)BioMapobj
A BioMap
объект, от SequenceValue
это содержит, он обозначает буквами представления последовательностей нуклеотида. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'Header'
,HeaderValue
)BioMapobj
A BioMap
объект, от HeaderValue
это содержит текст заголовка для последовательностей нуклеотида. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'Quality'
,QualityValue
)BioMapobj
A BioMap
объект, от QualityValue
это содержит представление ASCII качественной музыки на основу к последовательностям нуклеотида. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'Reference'
,ReferenceValue
)BioMapobj
A BioMap
объект и наборы Reference
свойство к ReferenceValue
это содержит имена ссылочных последовательностей. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'Signature'
,SignatureValue
)BioMapobj
A BioMap
объект, от SignatureValue
это содержит информацию, описывающую выравнивание каждой последовательности чтения со ссылочной последовательностью. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'Start'
,StartValue
)BioMapobj
A BioMap
объект, от StartValue
, вектор из положительных целых чисел, задающих положение в ссылочной последовательности, где выравнивание каждой последовательности чтения запускается. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'Flag'
,FlagValue
)BioMapobj
A BioMap
объект, от FlagValue
, вектор из положительных целых чисел, указывающих на поразрядную информацию для состояния 11 флагов, задан спецификацией формата SAM. Эти флаги описывают различные аспекты секвенирования и выравнивания последовательностей чтения. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'MappingQuality'
,MappingQualityValue
)BioMapobj
A BioMap
объект, от MappingQualityValue
, вектор из положительных целых чисел, задающих качество отображения для каждой последовательности чтения. Эта пара "имя-значение" работает, только если данные считаны в память.
построения BioMapobj
= BioMap(___,'MatePosition'
,MatePositionValue
)BioMapobj
A BioMap
объект, от MatePositionValue
, вектор из неотрицательных целых чисел, задающих положение помощника для каждой последовательности чтения. Эта пара "имя-значение" работает, только если данные считаны в память.
|
Вектор символов или строка, задающая SAM-или отформатированный BAM файл, который содержит только одну ссылочную последовательность и чьи чтения упорядочены положением запуска в ссылочной последовательности. |
|
Структура MATLAB, содержащая последовательность и информацию о выравнивании, такой, как возвращено |
|
Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий имя ссылочных последовательностей в |
|
Логическое определение, поместить ли данные в память или оставить данные в исходном файле. Отъезд данных в исходном файле и доступ к нему через индексный файл используют память более эффективно, но не позволяют вам изменить свойства По умолчанию: false |
|
Вектор символов или строка, задающая путь к папке, где индексный файл или существует или будет создан. Значение по умолчанию: Папка, где |
|
Вектор строки или массив ячеек из символьных векторов, содержащий представления буквы последовательностей нуклеотида. Эта информация заполняет |
|
Вектор строки или массив ячеек из символьных векторов, содержащий представление ASCII качественной музыки на основу к последовательностям нуклеотида. Эта информация заполняет |
|
Вектор строки или массив ячеек из символьных векторов, содержащий текст заголовка для последовательностей нуклеотида. Эта информация заполняет |
|
Вектор символов или строка, описывающая Значение по умолчанию: |
|
Вектор строки или массив ячеек из символьных векторов, содержащий имена ссылочных последовательностей. Эта информация заполняет |
|
Вектор строки или массив ячеек из символьных векторов, содержащий информацию, описывающую выравнивание каждой последовательности чтения со ссылочной последовательностью. |
|
Вектор из положительных целых чисел, задающих положение в ссылочной последовательности, где выравнивание каждой последовательности чтения запускается. Эта информация заполняет |
|
Вектор из положительных целых чисел, указывающих на поразрядную информацию для состояния 11 флагов, задан спецификацией формата SAM. Эти флаги описывают различные аспекты секвенирования и выравнивания последовательностей чтения. Эта информация заполняет |
|
Вектор из положительных целых чисел, задающих качество отображения для каждой последовательности чтения. Эта информация заполняет |
|
Вектор из неотрицательных целых чисел, задающих положение помощника для каждой последовательности чтения. Эта информация заполняет |
|
Флаги, сопоставленные со всеми последовательностями чтения, представленными в Вектор из положительных целых чисел, таким образом, что существует целое число для каждой последовательности чтения в объекте. Каждое целое число указывает на поразрядную информацию, которая задает состояние 11 флагов, описанных спецификацией формата SAM. Эти флаги описывают различные аспекты секвенирования и выравнивания последовательности чтения. Непосредственное отношение существует между номером и порядком элементов в |
|
Заголовки, сопоставленные со всеми последовательностями чтения, представленными в Массив ячеек из символьных векторов, такой, что существует заголовок для каждой последовательности чтения в объекте. Заголовки могут быть пустыми. Непосредственное отношение существует между номером и порядком элементов в |
|
Положения помощников для всех последовательностей чтения, представленных в Вектор из неотрицательных целых чисел, таким образом, что существует целое число для каждой последовательности чтения в объекте. Каждое целое число указывает на положение соответствующей последовательности помощника относительно ссылочной последовательности. Непосредственное отношение существует между номером и порядком элементов в Не все значения в |
|
Отображение качественных баллов, сопоставленных со всеми последовательностями чтения, представленными в Вектор из целых чисел, таких, что существует качественный счет отображения к каждой последовательности чтения в объекте. Непосредственное отношение существует между номером и порядком элементов в |
|
Описание Вектор символов, описывающий Значение по умолчанию: |
|
Количество последовательностей в Эта информация только для чтения. |
|
Качественные баллы на основу, сопоставленные со всеми последовательностями чтения, представленными в Массив ячеек из символьных векторов, такой, что существует качество для каждой последовательности чтения в объекте. Каждое качество является представлением ASCII качественной музыки на основу к последовательности чтения. Качество может быть пустым символьным вектором. Непосредственное отношение существует между номером и порядком элементов в |
|
Ссылочные последовательности в
Ссылочные последовательности являются последовательностями, против которых выравниваются последовательности чтения. |
|
Считайте последовательности в Массив ячеек из символьных векторов, содержащий представления буквы последовательностей чтения. |
|
Массив ячеек из символьных векторов, который каталогизирует имена ссылок, доступных в Эта информация только для чтения. |
|
Информация о выравнивании, сопоставленная со всеми последовательностями чтения, представленными в Массив ячеек отформатированных СИГАРОЙ векторов символов, таких, что существует информация о выравнивании для каждой последовательности чтения в объекте. Каждый вектор символов представляет, как последовательность чтения выравнивается к ссылочной последовательности. Подписи могут быть пустыми символьными векторами. Непосредственное отношение существует между номером и порядком элементов в |
|
Запустите положения всех выровненных последовательностей чтения, представленных в Вектор из целых чисел, таких, что существует положение запуска для каждой последовательности чтения в объекте. Каждое целое число задает положение запуска выровненной последовательности чтения относительно чисел положения в ссылочной последовательности. Непосредственное отношение существует между номером и порядком элементов в |
filterByFlag | Отфильтруйте чтения последовательности флагом SAM |
getAlignment | Создайте выравнивание, представленное в BioMap объект |
getBaseCoverage | Возвратите покрытие выравнивания основы основой ссылочной последовательности в BioMap объект |
getCompactAlignment | Создайте компактное выравнивание, представленное в BioMap объект |
getCounts | Возвратите количество последовательностей чтения, выровненных к ссылочной последовательности в BioMap объект |
getFlag | Получите флаги последовательности чтения из BioMap объект |
getIndex | Возвратите индексы последовательностей чтения, выровненных к ссылочной последовательности в BioMap объект |
getInfo | Получите информацию для одного элемента BioMap объект |
getMappingQuality | Получите последовательность, сопоставляющую качественные баллы от BioMap объект |
getMatePosition | Получите положения помощника последовательностей чтения от BioMap объект |
getReference | Получите ссылочную последовательность из BioMap объект |
getSignature | Получите подпись (информация о выравнивании) от BioMap объект |
getStart | Получите запускают положения выровненных последовательностей чтения от BioMap объект |
getStop | Вычислите положения остановки выровненных последовательностей чтения от BioMap объект |
getSummary | Распечатайте сводные данные BioMap объект |
setFlag | Установите флаги последовательности чтения для BioMap объект |
setMappingQuality | Установите последовательность, сопоставляющую качественную музыку к BioMap объект |
setMatePosition | Установите положения помощника последовательностей чтения в BioMap объект |
setReference | Определите имя ссылочной последовательности для BioMap объект |
setSignature | Установите подпись (информация о выравнивании) для BioMap объект |
setStart | Установите запускают положения выровненных последовательностей чтения в BioMap объект |
combine | Объедините два объекта |
get | Получите свойство объекта |
getHeader | Получите заголовки последовательности из объекта |
getQuality | Получите информацию о качестве последовательности из объекта |
getSequence | Получите последовательности из объекта |
getSubsequence | Получите частичные последовательности из объекта |
getSubset | Получите подмножество элементов от объекта |
set | Установите свойство объекта |
setHeader | Обновите информацию о заголовке чтений |
setQuality | Обновите информацию о качестве |
setSequence | Обновите последовательности чтения |
setSubsequence | Обновите частичные последовательности |
setSubset | Обновите элементы объекта |
write | Запишите содержимое объекта BioRead или BioMap зарегистрировать |
Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов в документации Основ программирования MATLAB.
BioMap
объекты поддерживают точку. при индексации, чтобы извлечь, присвойте и удалите данные.
BioIndexedFile
| BioRead
| saminfo
| samread
| baminfo
| bamread
| align2cigar
| cigar2align