Опции для сопоставления чтения с ссылочной последовательностью
A Bowtie2AlignOptions
объект содержит опции, чтобы запустить bowtie2
функция, которая выравнивается по значению в ссылочной последовательности.
создает alignOptions
= Bowtie2AlignOptionsBowtie2AlignOptions
объект со значениями свойств по умолчанию.
Bowtie2AlignOptions
требуется интерфейс Bioinformatics Toolbox™ для Bowtie Aligner. Если этот пакет поддержки не установлен, то функция предоставляет ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.
Примечание
Bowtie2AlignOptions
поддерживается в Mac и UNIX® только платформы.
устанавливает свойства с помощью одного или нескольких аргументов пары "имя-значение". Заключайте каждое имя свойства в кавычки. Для примера, alignOptions
= Bowtie2AlignOptions(Name,Value)alignOptions = Bowtie2AlignOptions('Trim5',10)
задает, чтобы отсечь 10 остатков от 5 '-конца.
S
- Параметры выравниванияПараметры выравнивания, заданные как вектор символов. S
должен находиться в синтаксисе опции Bowtie 2 (с префиксом одной или двух штрихов) [1].
AllowDovetail
- Флаг, разрешающий строениям dovetailfalse
(по умолчанию) | true
Флаг для разрешения строений dovetail, заданный как true
или false
. Это свойство определяет, может ли выравнивание одного сопрягаемого элемента продолжаться мимо начала выравнивания другого сопрягаемого элемента и считаться согласованным.
Это свойство применяется только к чтению в парном конце.
Пример: 'AllowDovetail',true
Типы данных: logical
AmbiguousPenalty
- Штраф за позиции с неоднозначными символами1
(по умолчанию) | неотрицательное целое числоШтраф за положения с неоднозначными символами в последовательности чтения, ссылочной последовательности или обоих в виде неотрицательного целого числа.
Пример:
'AmbiguousPenalty',2
Типы данных: double
Encoding
- Формат кодирования базового качества'Phred33'
(по умолчанию) | 'Phred64'
| 'Solexa'
Формат кодировки базового качества в файлах входа, заданный как один из следующих: 'Phred33'
, 'Phred64'
, или 'Solexa'
.
Пример: 'Encoding','Phred64'
Типы данных: char
| string
ExcludeContain
- Флаг, позволяющий одной сопряженной выравниванию содержать другую сопряженнуюfalse
(по умолчанию) | true
Флаг, позволяющий одному сопряженному выравниванию содержать выравнивание другого сопряженного соединения и считаться согласованным, заданным как true
или false
.
Это свойство применяется только к чтению в парном конце.
Пример: 'ExcludeContain',true
Типы данных: logical
ExcludeDiscordant
- Флаг, включающий несоответствующие выравниванияfalse
(по умолчанию) | true
Флаг, включающий несоответствующие выравнивания, заданный как true
или false
. Несоответствующее выравнивание является выравниванием, где оба пары выравниваются уникально, но не таким образом, чтобы удовлетворять ограничениям парного конца.
Пример: 'ExcludeDiscordant',true
Типы данных: logical
ExcludeMixed
- Флаг для исключения смешанных выравниванийfalse
(по умолчанию) | true
Флаг для исключения смешанных выравниваний, заданный как true
или false
. Смешанное выравнивание состоит из сопутствующих чтений, которые не являются согласованными или несоответствующими, но выравниваются по отдельности.
Это свойство применяется только к чтению в парном конце.
Пример: 'ExcludeMixed',true
Типы данных: logical
ExcludeOverlap
- Флаг, позволяющий совмещать перекрытие выравниванияfalse
(по умолчанию) | true
Флаг, позволяющий совмещению одного сопряжения перекрывать с выравниванием другого сопряжения и считаться согласованным, заданный как true
или false
.
Пример: 'ExcludeOverlap',true
Типы данных: logical
ExcludeUnaligned
- Флаг, чтобы исключить чтение, которое не удалось выровнятьfalse
(по умолчанию) | true
Флаг для исключения показаний, которые не удалось выровнять, заданный как true
или false
.
Пример: 'ExcludeUnaligned',true
Типы данных: logical
ExtraBowtie2Command
- Дополнительные опции, не включенные в свойства объекта''
(по умолчанию) | вектор символовДополнительные опции, не включенные в свойства объекта, заданные как вектор символов. Вектор символов должен быть в синтаксисе опции Bowtie 2 (с префиксом одной или двух штрихов). Значение по умолчанию является пустым символьным вектором ''
.
Пример: 'ExtraBowtie2Command','--version'
Типы данных: char
| string
IgnoreQuality
- Флаг, чтобы игнорировать считанное качество положенияfalse
(по умолчанию) | true
Флаг для игнорирования фактического качества позиции чтения при возникновении несоответствия, заданный как true
или false
. Установка значения свойства true
позволяет, чтобы значение качества в этом несоответствующем положении было максимально возможным, независимо от фактического значения.
Пример: 'IgnoreQuality',true
Типы данных: logical
MatchBonus
- Вознаграждение добавлено к счету за выравнивание2
(по умолчанию) | неотрицательное целое числоВознаграждение, добавленное к счету выравнивания, когда положение в считанном значении совпадает с положением в ссылке, заданным как неотрицательное целое число.
Пример: 'MatchBonus',5
Типы данных: double
MaxAmbiguousFunction
- Функция, регулирующая максимальное количество неоднозначных символов'L,0,0.15'
(по умолчанию) | вектор символов | строкаФункция, определяющая максимальное количество неоднозначных символов, разрешенных в считывании, заданных в виде вектора символов или строки.
Функция имеет формат 'f,B,A'
, где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:
'C'
- Константа
'L'
- Линейный
'S'
- Квадратный корень
'G'
- Естественный журнал
Получившаяся функция H(x) = B + A * f(x)
, где x - длина чтения.
Функция по умолчанию 'L,0,0.15'
, то есть H(x) = 0 + 0.15 * x
.
Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'
Типы данных: char
| string
MemoryMappedIndex
- Флаг для использования размещения в ОЗУ при загрузке индексаfalse
(по умолчанию) | true
Флаг для использования размещения в ОЗУ (вместо файловых вводов-выводов) при загрузке индекса, заданный как true
или false
. Размещение в ОЗУ позволяет многим параллельным процессам совместно использовать изображение памяти индекса, что приводит к более эффективной параллелизации задачи.
Пример: 'MemoryMappedIndex',true
Типы данных: logical
MinScoreFunction
- Функция, регулирующая минимальный порог счета выравниванияФункция, определяющая минимальный порог счета выравнивания, заданный как вектор символов или строка.
Функция имеет формат 'f,B,A'
, где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:
'C'
- Константа
'L'
- Линейный
'S'
- Квадратный корень
'G'
- Естественный журнал
Получившаяся функция H(x) = B + A * f(x)
, где x - длина чтения.
Для 'EndToEnd'
режим выравнивания, функция по умолчанию 'L,-0.6,-0.6'
. Для 'Local'
mode, функция по умолчанию 'G,20,8'
.
Пример: 'MinScoreFunction','L,-0.4,-0.6'
Типы данных: char
| string
MismatchPenalty
- Максимальное и минимальное значения для вычисления штрафа за несоответствие[6 2]
(по умолчанию) | двухэлементный векторМаксимальное и минимальное значения для вычисления штрафа за несоответствие во время выравнивания, заданные как двухэлементный вектор. Первый элемент является максимальным значением, а второй элемент - минимальным значением.
Число, меньше чем или равное максимальному значению и больше чем или равное минимальному значению, вычитается из счета выравнивания для каждой позиции, где считанный символ выравнивается к ссылке символу, символы не совпадают, и не является N
символ.
Пример: 'MismatchPenalty',[5 3]
Типы данных: double
Mode
- Режим выравнивания'EndToEnd'
(по умолчанию) | 'Local'
Режим выравнивания, заданный как 'EndToEnd'
или 'Local'
.
В 'Local'
mode, только часть чтения должна выровняться по ссылке, и некоторые остатки могут быть опущены (мягко отсечены), чтобы достичь наилучшего счета выравнивания. В 'EndToEnd'
режим, все чтение должно выровняться без каких-либо мягких отсечек.
Пример: 'Mode','Local'
Типы данных: char
| string
Nondeterministic
- Флаг для повторной инициализации псевдослучайного генератораfalse
(по умолчанию) | true
Флаг для повторной инициализации псевдослучайного генератора для каждого чтения с использованием текущего времени, заданного как true
или false
. Если true
выравнивания, сообщенные для двух одинаковых чтений, могут быть различными. Значение по умолчанию false
, то есть, псевдослучайный генератор повторно инициализируется с использованием seed, полученного из считанной информации и начального числа.
Пример: 'Nondeterministic',true
Типы данных: logical
NoGapPositions
- Количество позиций, в которых пропуски не допускаются4
(по умолчанию) | неотрицательное целое числоКоличество позиций в начале или конце каждого чтения, где погрешности не разрешены, заданное как неотрицательное целое число.
Пример: 'NoGapPositions',5
Типы данных: double
NumAlignments
- Максимальное количество допустимых выравниваний в отчете'Best'
(по умолчанию) | 'All'
| положительное целое числоМаксимальное количество допустимых выравниваний для отчета перед завершением поиска, заданное в виде положительного целого числа 'Best'
, или 'All'
. Если вы задаете положительное целое N, функция ищет до N различных, допустимых выравниваний для каждого чтения. 'Best'
сообщает оптимальное выравнивание для каждого прочитанного. 'All'
сообщает обо всех допустимых выравниваниях для каждого считанного значения, отсортированного по счетам выравнивания.
Счет выравнивания для выравнивания на парном конце равен сумме счетов выравнивания для отдельных пар.
Пример: 'NumAlignments','All'
Типы данных: double
| char
| string
NumReseedings
- Максимальное количество попыток повторного обслуживания2
(по умолчанию) | неотрицательное целое числоМаксимальное количество попыток повторного набора с повторяющимися началами, заданное в виде неотрицательного целого числа. Во время повторного заполнения функция выбирает новый набор чтений с различными смещениями, чтобы найти больше выравнивания.
Пример: 'NumReseedings',5
Типы данных: double
NumSeedExtensions
- Максимальное количество последовательных попыток расширения seed15
(по умолчанию) | неотрицательное целое числоМаксимальное количество последовательных попыток расширения seed перед получением нового seed, заданное как неотрицательное целое число. Расширение seed терпит неудачу, если оно не приводит к выравниванию по лучшему (или второму лучшему) счету.
Пример: 'NumSeedExtensions',10
Типы данных: double
NumSeedMismatches
- Количество допустимых несоответствий в выравнивании seed0
(по умолчанию) | 1
Количество допустимых несоответствий в выравнивании seed во время многосветного выравнивания, заданное как 0 или
1
.
Пример: 'NumSeedMismatches',1
Типы данных: double
NumThreads
- Количество параллельных резьб для выполнения выравнивания1
(по умолчанию) | положительное целое числоКоличество параллельных потоков для выполнения выравнивания, заданное в виде положительного целого числа. Потоки выполняются на отдельных процессорах или ядрах. Увеличение количества потоков обеспечивает значительное увеличение скорости (близкое к линейному), но также увеличивает площадь памяти.
Пример: 'NumThreads',4
Типы данных: double
Offrate
- Смещение для использования при считывании индексаNaN
(по умолчанию) | положительное целое числоOffrate, используемый при чтении индекса, чтобы уменьшить размер памяти, заданный как положительное целое число. Смещение должно быть больше, чем смещение, используемое для построения индекса.
Пример: 'Offrate',20
Типы данных: double
PadPositions
- Положение в исходной последовательности, где начинается выравнивание15
(по умолчанию) | неотрицательное целое числоПоложение в ссылочной последовательности, где начинается выравнивание для каждой последовательности, заданное как неотрицательное целое число.
Пример: 'PadPositions',10
Типы данных: double
ReadGapCosts
- Затраты на разрыв для открытия и расширения разрыва[5 3]
(по умолчанию) | двухэлементный вектор неотрицательных целых чиселЗатраты на разрыв для открытия и расширения разрыва на считываемом элементе, заданные как двухэлементный вектор неотрицательных целых чисел. Первый элемент является стоимостью открытия зазора, а второй элемент - стоимостью расширения зазора. Учитывая вектор затрат [GO GE]
, зазор считывания длины N назначается штраф в GO + N * GE
.
Пример: 'ReadGapCosts',[4 2]
Типы данных: double
ReadGroupID
- Считайте идентификатор группы, чтобы добавить @RG
линия заголовка''
(по умолчанию) | вектор символов | строкаСчитайте идентификатор группы для добавления на @RG
заголовок линии в выход отчете SAM, заданный как вектор символов или строка. Если вы задаете любой идентификатор группы чтения, функция печатает @RG
линия заголовка с тегом ID:
далее указан указанный идентификатор группы.
Пример: 'ReadGroupID','ID1'
Типы данных: char
| string
ReadGroup
- Считайте информацию о группе, чтобы добавить как поле на @RG
линия заголовка''
(по умолчанию) | вектор символов | строкаЧтение информации о группе для добавления в качестве поля на @RG
заголовок линии в выход отчете SAM, заданный как вектор символов или строка. Это свойство применяется только в том случае, если вы задаете 'ReadGroupID'
.
Пример: 'ReadGroup','Control'
Типы данных: char
| string
RefGapCosts
- Затраты на разрыв для открытия и расширения разрыва[5 3]
(по умолчанию) | двухэлементный вектор неотрицательных целых чиселЗатраты на разрыв для открытия и расширения разрыва на опорном элементе, заданные как двухэлементный вектор неотрицательных целых чисел. Первый элемент является стоимостью открытия зазора, а второй элемент - стоимостью расширения зазора. Учитывая вектор затрат [GO GE]
, ссылка зазор длины N назначается штраф GO + N * GE
.
Пример: 'RefGapCosts',[4 2]
Типы данных: double
Reorder
- Флаг для переупорядочивания записей SAMfalse
(по умолчанию) | true
Флаг для переупорядочивания записей SAM для поддержания того же порядка, как в входных файлах, заданный как true
или false
. Это свойство применяется только, когда количество параллельных потоков больше единицы. Когда вы используете один поток, порядок записей в выходе тот же, что и порядок входов.
Пример: 'Reorder',true
Типы данных: logical
Seed
- Число для установки seed в генераторе псевдослучайных чисел0
(по умолчанию) | неотрицательное целое числоЧисло для установки seed в генераторе псевдослучайных чисел в виде неотрицательного целого числа.
Пример: 'Seed',3
Типы данных: double
SeedIntervalFunction
- Функция, регулирующая расстояние между начальными подстрокамиФункция, регулирующая расстояние между подстроками seed во время выравнивания мультиseed, заданная как вектор символов или строка.
Функция имеет формат 'f,B,A'
, где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:
'C'
- Константа
'L'
- Линейный
'S'
- Квадратный корень
'G'
- Естественный журнал
Получившаяся функция H(x) = B + A * f(x)
, где x - длина чтения.
Для 'EndToEnd'
режим выравнивания, функция по умолчанию 'S,1,1.15'
. Для 'Local'
mode, функция по умолчанию 'S,1,0.75'
.
Пример: 'SeedIntervalFunction','S,2,2.15'
Типы данных: char
| string
SeedLength
- Длина начальной подстроки для выравнивания во время многосветной выравнивания20
(по умолчанию) | положительное целое числоSeed подстроки для выравнивания во время многосветного выравнивания, заданная как положительное целое число.
Пример: 'SeedLength',25
Типы данных: double
Skip
- Количество чтений, которые нужно игнорировать0
(по умолчанию) | неотрицательное целое числоКоличество чтений, которые нужно игнорировать из начала входных файлов, заданное как неотрицательное целое число.
Пример: 'Skip',5
Типы данных: double
Trim3
- Количество остатков для обрезки с 3 '-конца0
(по умолчанию) | неотрицательное целое числоКоличество остатков, которые нужно отсечь из 3 '-конца каждого считанного перед выравниванием, заданное как неотрицательное целое число.
Пример: 'Trim3',5
Типы данных: double
Trim5
- Количество остатков для обрезки с 5 '-конца0
(по умолчанию) | неотрицательное целое числоКоличество остатков, которые нужно отсечь из 5 '-конца каждого считанного перед выравниванием, заданное как неотрицательное целое число.
Пример: 'Trim5',5
Типы данных: double
UpTo
- Количество чтений, учитываемых из начала входных файловInf
(по умолчанию) | положительное целое числоКоличество чтений, учитываемых с начала входа файлов, заданное как положительное целое число. Значение по умолчанию Inf
, то есть рассматриваются все чтения.
Пример: 'UpTo',1000
Типы данных: double
getBowtie2Command | Переведите свойства объекта в опции Bowtie 2 |
getBowtie2Table | Извлечение таблицы со свойствами объекта и эквивалентными опциями Bowtie 2 |
preset | Установите комбинацию опций выравнивания |
run | Сопоставить последовательность чтения в ссылочную последовательность используя Bowtie 2 |
Создайте набор файлов индекса для генома дрозофилы. Сообщение об ошибке появляется, если при запуске функции не установлен пакет поддержки Bioinformatics Toolbox для Bowtie Aligner. Щелкните указанную ссылку, чтобы загрузить пакет из меню Add-on.
В данном примере ссылочная последовательность Dmel_chr4.fa
уже поставляется с тулбоксом.
status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');
Если построение индекса успешно, функция возвращается 0
и создает файлы индексов (*.bt2
) в текущей папке. Файлы имеют префикс 'Dmel_chr4_index'
.
Иногда файлы индекса существуют, и вы хотите знать ссылочную последовательность, используемую для построения индекса. В этом случае используйте bowtie2inspect
функция для получения дополнительной информации об ссылке.
bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');
По умолчанию файл выхода Dmel_chr4_retrieved.fa
содержит последовательность ссылки. Можно также получить сводную информацию о имени ссылки и длинах вместо фактической последовательности. Для получения дополнительной информации о доступных опциях смотрите Bowtie2InspectOptions
.
Когда индекс будет готов, сопоставьте последовательности чтения со ссылкой с помощью bowtie2
функция. Файлы чтения парного конца (SRR6008575_10k_1.fq
и SRR6008575_10k_2.fq
) уже поставляются с тулбоксом.
bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');
Выходы являются файлом в формате SAM, который содержит результаты отображения.
Можно задать различные опции выравнивания, передав синтаксическую строку Bowtie 2 или используя Bowtie2AlignOptions
объект.
Предположим, что вы хотите отсечь некоторые остатки от 3'
заканчивается перед выравниванием. Во-первых, создайте Bowtie2AlignOptions
объект.
alignOpt = Bowtie2AlignOptions;
Обрезка четырех остатков из 3'
заканчивается перед выравниванием.
alignOpt.Trim3 = 4;
Чтение карты на ссылку с помощью заданной опции выравнивания.
flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);
[1] Langmead, B., and S. Salzberg. «Быстрое выравнивание чтения с перерывами с Bowtie 2». Природные методы. 9, 2012, 357–359.
bowtie2
| Bowtie2AlignOptions
| bowtie2build
| Bowtie2BuildOptions
| bowtie2inspect
| Bowtie2InspectOptions
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.