Суперклассы: BioRead
Содержат данные последовательности, качества, выравнивания и отображения
BioMap
класс содержит данные из коротко считанных последовательностей, включая заголовки последовательностей, считанные последовательности, счета качества для последовательностей и данные о том, как каждая последовательность выравнивается к заданной ссылке. Эти данные обычно получают с высокопроизводительного устройства секвенирования.
Создайте a BioMap
объект из данных последовательности с коротким чтением. Каждый элемент объекта имеет связанную с ним последовательность, заголовок, счет качества и информацию о выравнивании/отображении. Используйте свойства и методы объекта для исследования, доступа, фильтрации и манипулирования всеми или подмножеством данных перед анализом или просмотром данных.
создает BioMapobj
= BioMapBioMapobj
, который является пустым BioMap
объект.
создает BioMapobj
= BioMap(File
)BioMapobj
, а BioMap
объект, из File
, САМ- или BAM-форматированный файл, чтения которого упорядочены по начальной позиции в ссылочной последовательности. Данные остаются в исходном файле, и BioMap
Объект обращается к нему с помощью одного или двух вспомогательных файлов индекса. Для файла в формате SAM, MATLAB® использует или создает один индексный файл, который должен иметь то же имя, что и исходный файл, но с .idx
расширение. Для файла в формате BAM MATLAB использует или создает два файла индекса, которые должны иметь то же имя, что и исходный файл, но с *.bai
и *.linearindex
расширения. Если файлы индекса не найдены в той же папке, что и исходный файл, BioMap
Функция конструктора создает файлы индекса в этой папке.
Когда вы передаете в неупорядоченном BAM-форматированном файле, конструктор автоматически заказывает файл и записывает данные в упорядоченный файл с тем же базовым именем и расширением с добавленным символьным вектором. «упорядоченный» перед расширением. Новый файл индексируется и используется для создания экземпляров нового BioMap
объект.
Примечание
Поскольку данные остаются в исходном файле и доступ к ним осуществляется с помощью файлов индекса:
Не удаляйте исходный файл (SAM или BAM).
Не удаляйте файлы индекса (*. idx
, *. bai
, или *. linearindex
).
Вы не можете изменять BioMapobj
свойства.
Совет
Чтобы определить количество ссылочных последовательностей, включенных в ваш исходный файл, используйте saminfo
или baminfo
функция. Используйте SAMtools, чтобы проверить, упорядочены ли чтения в вашем исходном файле по положению в ссылочной последовательности, а также, при необходимости, переупорядочить их.
создает BioMapobj
= BioMap(Struct
)BioMapobj
, а BioMap
объект, из Struct
, структуру MATLAB, содержащую информацию о последовательности и выравнивании, такую как возвращенная samread
или bamread
функция. Данные из Struct
остается в памяти, что позволяет изменять BioMapobj
свойства.
создает BioMapobj
= BioMap(___,'Name
',Value
)BioMap
объект использует любой из предыдущих входных параметров и дополнительные опции, заданные в виде аргументов пары "имя-значение" следующим образом.
выбирает одну или несколько ссылок, когда исходные данные содержат последовательности, сопоставленные с несколькими ссылками. По умолчанию конструктор включает все ссылки в словарь заголовков исходного файла. Когда словарь заголовков недоступен, конструктор по умолчанию включает все имена ссылок, найденные в исходных данных. BioMapobj
= BioMap(___,'SelectReference'
,SelectRefValue
)SelectRefValue
- вектор символов, строка, строковый вектор или массив ячеек из векторов символов. При помощи этой опции можно предотвратить BioMap
конструктор от создания вспомогательных файлов индексов для ссылок, которые вы не будете использовать в анализе. Если какие-либо чтения, сопоставленные с выбранными ссылками, являются парными и BioMapobj
записывается в файл, ссылочные последовательности сопряженных также включаются в заголовок файла.
определяет, помещать ли данные в память или оставлять данные в исходном файле. Оставить данные в исходном файле и получить доступ через индекс файл более эффективно с точки зрения памяти, но не позволяет изменять свойства BioMapobj
= BioMap(File
,'InMemory'
,InMemoryValue
)BioMapobj
. Варианты true
или false
(по умолчанию). Если первый входной параметр не является именем файла, то этот аргумент пары "имя-значение" игнорируется, и данные автоматически помещаются в память.
Совет
Установите 'InMemory'
аргумент пары "имя-значение" в true
если необходимо изменить свойства BioMapobj
.
задает путь к папке, в которой находятся индексные файлы (*. BioMapobj
= BioMap(___,'IndexDir'
,IndexDirValue
)idx
, *. bai
, или *. linearindex
) существовать или будет создан.
Совет
Используйте 'IndexDir'
аргумент пары "имя-значение", если у вас нет доступа на запись к папке, в которой расположен исходный файл.
создает BioMapobj
= BioMap(___,'Sequence'
,SequenceValue
)BioMapobj
, а BioMap
объект, из SequenceValue
который содержит букву ему представления нуклеотидных последовательностей. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'Header'
,HeaderValue
)BioMapobj
, а BioMap
объект, из HeaderValue
который содержит текст заголовка для нуклеотидных последовательностей. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'Quality'
,QualityValue
)BioMapobj
, а BioMap
объект, из QualityValue
который содержит представление ASCII счетов качества по основаниям для нуклеотидных последовательностей. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'Reference'
,ReferenceValue
)BioMapobj
, а BioMap
объект, и устанавливает Reference
свойство к ReferenceValue
который содержит имена ссылочных последовательностей. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'Signature'
,SignatureValue
)BioMapobj
, а BioMap
объект, из SignatureValue
который содержит информацию, описывающую выравнивание каждой последовательности чтения с ссылкой последовательностью. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'Start'
,StartValue
)BioMapobj
, а BioMap
объект, из StartValue
вектор положительных целых чисел, задающий положение в ссылке последовательности, с которого начинается выравнивание каждой считанной последовательности. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'Flag'
,FlagValue
)BioMapobj
, а BioMap
объект, из FlagValue
вектор положительных целых чисел, указывающий битовую информацию для состояния 11 флагов, заданных спецификацией формата SAM. Эти флаги описывают различные аспекты секвенирования и выравнивания считанных последовательностей. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'MappingQuality'
,MappingQualityValue
)BioMapobj
, а BioMap
объект, из MappingQualityValue
вектор положительных целых чисел, задающий качество отображения для каждой последовательности чтения. Эта пара "имя-значение" работает только, если данные считываются в память.
создает BioMapobj
= BioMap(___,'MatePosition'
,MatePositionValue
)BioMapobj
, а BioMap
объект, из MatePositionValue
вектор неотрицательных целых чисел, задающий положение совмещения для каждой считанной последовательности. Эта пара "имя-значение" работает только, если данные считываются в память.
|
Вектор символов или строка, задающая файл с форматированием САМ- или БАМ, который содержит только одну ссылочную последовательность и чтения которого упорядочены по начальной позиции в ссылочной последовательности. |
|
Структура MATLAB, содержащая информацию о последовательности и выравнивании, такую как возвращенная |
|
Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих имя ссылочных последовательностей в |
|
Логическое определение, помещать ли данные в память или оставлять данные в исходном файле. Оставить данные в исходном файле и получить к ним доступ через индекс файл более эффективно с точки зрения памяти, но не позволяет изменять свойства По умолчанию: |
|
Вектор символов или строка, указывающая путь к папке, в которой либо существует файл индекса, либо будет создан. По умолчанию: Папка, где |
|
Вектор строка или массив ячеек из векторов символов, содержащих буквенные представления нуклеотидных последовательностей. Эта информация заполняет |
|
Вектор строка или массив ячеек из векторов символов, содержащий представление ASCII счетов качества по основаниям для нуклеотидных последовательностей. Эта информация заполняет |
|
Вектор строка или массив ячеек из векторов символов, содержащий текст заголовка для нуклеотидных последовательностей. Эта информация заполняет |
|
Вектор символов или строка, описывающая По умолчанию: |
|
Вектор строка или массив ячеек из векторов символов, содержащих имена ссылочных последовательностей. Эта информация заполняет |
|
Строка вектор или массив ячеек векторов символов, содержащий информацию, описывающую выравнивание каждой последовательности чтения с ссылкой последовательностью. |
|
Вектор положительных целых чисел, задающий положение в ссылке последовательности, с которого начинается выравнивание каждой последовательности чтения. Эта информация заполняет |
|
Вектор положительных целых чисел, указывающий битовую информацию для состояния 11 флагов, заданных спецификацией формата SAM. Эти флаги описывают различные аспекты секвенирования и выравнивания считанных последовательностей. Эта информация заполняет |
|
Вектор положительных целых чисел, задающий качество отображения для каждой последовательности чтения. Эта информация заполняет |
|
Вектор неотрицательных целых чисел, задающий положение совмещения для каждой последовательности чтения. Эта информация заполняет |
|
Флаги, связанные со всеми последовательностями чтения, представленными в Вектор положительных целых чисел, такой что существует целое число для каждой последовательности чтения в объекте. Каждое целое число указывает битовую информацию, которая задает состояние 11 флагов, описанных спецификацией формата SAM. Эти флаги описывают различные аспекты секвенирования и выравнивания последовательности чтения. Отношение «один к одному» существует между количеством и порядком элементов в |
|
Заголовки, сопоставленные со всеми последовательностями чтения, представленными в Массив ячеек из символьных векторов, такой что существует заголовок для каждой последовательности чтения в объекте. Заголовки могут быть пустыми. Отношение «один к одному» существует между количеством и порядком элементов в |
|
Положения пар для всех считанных последовательностей, представленных в Вектор неотрицательных целых чисел, таких что существует целое число для каждой последовательности чтения в объекте. Каждое целое число указывает положение соответствующей последовательности сопряжения относительно последовательности ссылки. Отношение «один к одному» существует между количеством и порядком элементов в Не все значения в |
|
Сопоставление счетов качества, сопоставленных со всеми последовательностями чтения, представленными в Вектор целых чисел, такой что существует счет качества отображения для каждой последовательности чтения в объекте. Отношение «один к одному» существует между количеством и порядком элементов в |
|
Описание Вектор символов, описывающий По умолчанию: |
|
Количество последовательностей в Эта информация доступна только для чтения. |
|
Счета качества на базу, сопоставленные со всеми последовательностями чтения, представленными в Массив ячеек из символьных векторов, такой что существует качество для каждой последовательности чтения в объекте. Каждое качество является ASCII-представлением счетов качества по основаниям для последовательности чтения. Качество может быть пустым символьным вектором. Отношение «один к одному» существует между количеством и порядком элементов в |
|
Ссылочные последовательности в
Эталонные последовательности являются последовательностями, относительно которых выровнены считанные последовательности. |
|
Считайте последовательности в Массив ячеек из символьных векторов, содержащий буквенные представления считанных последовательностей. |
|
Массив ячеек из символьных векторов, который каталогизирует имена ссылок, доступных в Эта информация доступна только для чтения. |
|
Информация о выравнивании, связанная со всеми считанными последовательностями, представленными в Массив ячеек из CIGAR-форматированных ячеек из символьных векторов, таким образом, что существует информация о выравнивании для каждой считанной последовательности в объекте. Каждый вектор символов представляет, как последовательность считывания выравнивается по ссылочной последовательности. Сигнатуры могут быть пустыми символьными векторами. Отношение «один к одному» существует между количеством и порядком элементов в |
|
Начальные положения всех выровненных последовательностей чтения, представленных в Вектор целых чисел, такой что существует стартовая позиция для каждой последовательности чтения в объекте. Каждое целое число задает начальное положение выровненной последовательности чтения относительно номеров позиций в ссылочной последовательности. Отношение «один к одному» существует между количеством и порядком элементов в |
filterByFlag | Последовательность фильтров считывается флагом SAM |
getAlignment | Создайте выравнивание, представленную в BioMap объект |
getBaseCoverage | Верните базовый по основаниям охват выравниванием последовательности ссылки в BioMap объект |
getCompactAlignment | Создайте компактное выравнивание, представленную в BioMap объект |
getCounts | Количество возвращенных считанных последовательностей, выровненных по ссылочной последовательности в BioMap объект |
getFlag | Извлечение флагов последовательности чтения из BioMap объект |
getIndex | Возвращает индексы считанных последовательностей, выровненных по ссылочной последовательности в BioMap объект |
getInfo | Извлечение информации для одного элемента BioMap объект |
getMappingQuality | Извлеките счета качества сопоставления последовательностей из BioMap объект |
getMatePosition | Извлеките совмещенные положения считанных последовательностей из BioMap объект |
getReference | Извлечение ссылочной последовательности из BioMap объект |
getSignature | Извлечение подписи (информация о выравнивании) из BioMap объект |
getStart | Извлеките начальные положения выровненных последовательностей чтения из BioMap объект |
getStop | Вычислите положения упора выровненных последовательностей чтения из BioMap объект |
getSummary | Печать сводных данных по BioMap объект |
setFlag | Установите флаги последовательности чтения для BioMap объект |
setMappingQuality | Установите счета качества сопоставления последовательностей для BioMap объект |
setMatePosition | Установите совмещенные положения считанных последовательностей в BioMap объект |
setReference | Установите имя ссылочной последовательности для BioMap объект |
setSignature | Установите сигнатуру (информацию о выравнивании) для BioMap объект |
setStart | Установите начальные положения выровненных последовательностей чтения в BioMap объект |
combine | Объедините два объекта |
get | Свойство Retrieve объекта |
getHeader | Извлечение заголовков последовательности из объекта |
getQuality | Извлечение информации о качестве последовательности из объекта |
getSequence | Извлечение последовательностей из объекта |
getSubsequence | Извлечение частичных последовательностей из объекта |
getSubset | Извлечение подмножества элементов из объекта |
set | Установите свойство объекта |
setHeader | Обновление информации заголовка чтений |
setQuality | Обновление информации о качестве |
setSequence | Обновите последовательности чтения |
setSubsequence | Обновление частичных последовательностей |
setSubset | Обновляйте элементы объекта |
write | Запись содержимого объекта BioRead или BioMap в файл |
Значение. Чтобы узнать, как классы значений влияют на операции копирования, смотрите раздел «Копирование объектов» в документации Основы Программирования MATLAB.
BioMap
объекты поддерживают точку. индексация для извлечения, назначения и удаления данных.
align2cigar
| bamindexread
| baminfo
| bamread
| BioIndexedFile
| BioRead
| cigar2align
| saminfo
| samread