Опции, чтобы сопоставить чтения со ссылочной последовательностью
Bowtie2AlignOptions объект содержит опции, чтобы запустить bowtie2 функция, которая выравнивает чтения к ссылочной последовательности.
создает alignOptions = Bowtie2AlignOptionsBowtie2AlignOptions объект со значениями свойств по умолчанию.
Bowtie2AlignOptions требует Интерфейса Bioinformatics Toolbox™ для пакета поддержки Выравнивателя Галстука-бабочки. Если этот пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.
Bowtie2AlignOptions поддерживается на Mac и платформах UNIX® только.
свойства наборов с помощью одного или нескольких аргументов пары "имя-значение". Заключите каждое имя свойства в кавычки. Например, alignOptions = Bowtie2AlignOptions(Name,Value)alignOptions = Bowtie2AlignOptions('Trim5',10) задает, чтобы обрезать 10 остатков от 5' концов.
S — Параметры выравниванияПараметры выравнивания в виде вектора символов. S должны быть в Галстуке-бабочке 2 синтаксиса опции (снабженный префиксом одним или двумя тире) [1].
AllowDovetail — Отметьте, чтобы позволить настройки ласточкиного хвостаfalse (значение по умолчанию) | trueОтметьте, чтобы позволить настройки ласточкиного хвоста в виде true или false. Это свойство задает, может ли выравнивание одного помощника расширить мимо начала выравнивания другого помощника и быть рассмотрено согласующееся.
Это свойство применяется к чтениям парного конца только.
Пример: 'AllowDovetail',true
Типы данных: логический
AmbiguousPenalty — Штраф за положения с неоднозначными символами (значение по умолчанию) | неотрицательное целое числоШтраф за положения с неоднозначными символами на последовательности чтения, ссылочной последовательности или обоих в виде неотрицательного целого числа.
Пример:
'AmbiguousPenalty',2
Типы данных: double
Encoding — Формат кодировки основного качества'Phred33' (значение по умолчанию) | 'Phred64' | 'Solexa' Формат кодировки основного качества во входных файлах в виде одного из следующего: 'Phred33', 'Phred64', или 'Solexa'.
Пример: 'Encoding','Phred64'
Типы данных: char | string
ExcludeContain — Отметьте, чтобы позволить одному выравниванию помощника содержать другого помощникаfalse (значение по умолчанию) | trueОтметьте, чтобы позволить одному выравниванию помощника содержать выравнивание другого помощника и рассматриваться согласующимся в виде true или false.
Это свойство применяется к чтениям парного конца только.
Пример: 'ExcludeContain',true
Типы данных: логический
ExcludeDiscordant — Отметьте, чтобы включать противоречащие выравниванияfalse (значение по умолчанию) | trueОтметьте, чтобы включать противоречащие выравнивания в виде true или false. Противоречащее выравнивание является выравниванием, где оба помощника выравниваются исключительно, но не способом, который удовлетворяет ограничениям парного конца.
Пример: 'ExcludeDiscordant',true
Типы данных: логический
ExcludeMixed — Отметьте, чтобы исключить смешанные выравниванияfalse (значение по умолчанию) | trueОтметьте, чтобы исключить смешанные выравнивания в виде true или false. Смешанное выравнивание состоит из чтений помощника, которые не являются согласующимися или противоречащими, но выравниваются индивидуально.
Это свойство применяется к чтениям парного конца только.
Пример: 'ExcludeMixed',true
Типы данных: логический
ExcludeOverlap — Отметьте, чтобы позволить перекрытие выравнивания помощникаfalse (значение по умолчанию) | trueОтметьте, чтобы позволить выравниванию одного помощника перекрываться с выравниванием другого помощника и рассматриваться согласующимся в виде true или false.
Пример: 'ExcludeOverlap',true
Типы данных: логический
ExcludeUnaligned — Отметьте, чтобы исключить чтения, которым не удалось выровнятьсяfalse (значение по умолчанию) | trueОтметьте, чтобы исключить чтения, которым не удалось выровняться в виде true или false.
Пример: 'ExcludeUnaligned',true
Типы данных: логический
ExtraBowtie2Command — Дополнительные опции, не включенные в свойства объектов'' (значение по умолчанию) | вектор символовДополнительные опции, не включенные в свойства объектов в виде вектора символов. Вектор символов должен быть в Галстуке-бабочке 2 синтаксисами опции (снабженный префиксом одним или двумя тире). Значением по умолчанию является пустой символьный вектор ''.
Пример: 'ExtraBowtie2Command','--version'
Типы данных: char | string
IgnoreQuality — Отметьте, чтобы проигнорировать качество положения чтенияfalse (значение по умолчанию) | trueОтметьте, чтобы проигнорировать фактическое качество положения чтения, когда несоответствие произойдет в виде true или false. Установка этого свойства к true позволяет качественному значению в том несовпадающем положении быть максимально возможным, независимо от фактического значения.
Пример: 'IgnoreQuality',true
Типы данных: логический
MatchBonus — Вознаграждение добавляется к счету выравнивания (значение по умолчанию) | неотрицательное целое числоВознаграждение, добавленное к выравниванию, выигрывает, когда положение в чтении совпадает с положением в ссылке в виде неотрицательного целого числа.
Пример: 'MatchBonus',5
Типы данных: double
MaxAmbiguousFunction — Функция, управляющая максимальным количеством неоднозначных символов'L,0,0.15' (значение по умолчанию) | вектор символов | строкаФункция, управляющая максимальным количеством неоднозначных символов, позволенных в чтении в виде вектора символов или строки.
Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:
'C'– Постоянный
'L'– Линейный
'S'– Квадратный корень
'G'– Естественный журнал
Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.
Функцией по умолчанию является 'L,0,0.15', то есть, H(x) = 0 + 0.15 * x.
Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'
Типы данных: char | string
MemoryMappedIndex — Отметьте, чтобы использовать размещение в ОЗУ при загрузке индексаfalse (значение по умолчанию) | trueОтметьте, чтобы использовать размещение в ОЗУ (вместо файлового ввода-вывода) при загрузке индекса в виде true или false. Размещение в ОЗУ позволяет многим параллельным процессам совместно использовать отображение памяти индекса, приводящего к более эффективному распараллеливанию задачи.
Пример: 'MemoryMappedIndex',true
Типы данных: логический
MinScoreFunction — Функция, управляющая минимумом, выигрывает порог выравниванияФункция, управляющая минимальным порогом счета выравнивания в виде вектора символов или строки.
Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:
'C'– Постоянный
'L'– Линейный
'S'– Квадратный корень
'G'– Естественный журнал
Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.
Для 'EndToEnd' режим выравнивания, функцией по умолчанию является 'L,-0.6,-0.6'. Для 'Local' режим, функцией по умолчанию является 'G,20,8'.
Пример: 'MinScoreFunction','L,-0.4,-0.6'
Типы данных: char | string
MismatchPenalty — Максимальные и минимальные значения, чтобы вычислить штраф несоответствия (значение по умолчанию) | двухэлементный векторМаксимальные и минимальные значения, чтобы вычислить штраф несоответствия во время выравнивания в виде двухэлементного вектора. Первым элементом является максимальное значение, и вторым элементом является минимальное значение.
Номер, меньше чем или равный максимальному значению и больше, чем или равный минимальному значению, вычтен из счета выравнивания к каждому положению, где символ чтения выравнивается к ссылочному символу, символы не соответствуют, и ни один не N символ.
Пример: 'MismatchPenalty',[5 3]
Типы данных: double
Mode — Режим Alignment'EndToEnd' (значение по умолчанию) | 'Local'Режим Alignment в виде 'EndToEnd' или 'Local'.
В 'Local' режим, только часть чтения должна выровняться к ссылке, и некоторые остатки могут быть не использованы (мягко отсеченные), чтобы достигнуть лучшего счета выравнивания. В 'EndToEnd' режим, целое чтение должно выровняться без любого мягкого усечения.
Пример: 'Mode','Local'
Типы данных: char | string
Nondeterministic — Отметьте, чтобы повторно инициализировать псевдослучайный генераторfalse (значение по умолчанию) | trueОтметьте, чтобы повторно инициализировать псевдослучайный генератор для каждого чтения с помощью текущего времени в виде true или false. Если true, выравнивания, о которых сообщают для двух идентичных чтений, могут отличаться. Значением по умолчанию является false, то есть, псевдослучайный генератор повторно инициализируется с помощью seed, выведенного из считанных информаций и номера seed.
Пример: 'Nondeterministic',true
Типы данных: логический
NoGapPositions — Количество положений, где разрывы не позволены (значение по умолчанию) | неотрицательное целое числоКоличество положений вначале или конца каждого чтения, где разрывы не позволены в виде неотрицательного целого числа.
Пример: 'NoGapPositions',5
Типы данных: double
NumAlignments — Максимальное количество допустимых выравниваний, чтобы сообщить'Best' (значение по умолчанию) | 'All' | положительное целое числоМаксимальное количество допустимых выравниваний, чтобы сообщить прежде, чем отключить поиск в виде положительного целого числа, 'Best', или 'All'. Если вы задаете положительный целочисленный N, функция ищет до N отличные, допустимые выравнивания для каждого чтения. 'Best' сообщает лучшее выравнивание для каждого чтения. 'All' отчеты все допустимые выравнивания для каждого чтения отсортированы по баллам выравнивания.
Счет выравнивания к выравниванию парного конца равняется сумме множества выравнивания отдельных помощников.
Пример: 'NumAlignments','All'
Типы данных: double | char | string
NumReseedings — Максимальное количество пересева попыток (значение по умолчанию) | неотрицательное целое числоМаксимальное количество пересева попыток с повторяющимися seed в виде неотрицательного целого числа. Во время пересева функция выбирает новый набор чтений при различных смещениях, чтобы найти больше выравниваний.
Пример: 'NumReseedings',5
Типы данных: double
NumSeedExtensions — Максимальное количество последовательных попыток расширения seed (значение по умолчанию) | неотрицательное целое числоМаксимальное количество последовательных попыток расширения seed прежде, чем получить новый seed в виде неотрицательного целого числа. Расширение seed перестало работать, если оно не дает к выравниванию с лучшим (или второсортный) счет.
Пример: 'NumSeedExtensions',10
Типы данных: double
NumSeedMismatches — Количество позволенных несоответствий в выравнивании seed (значение по умолчанию) | 1Количество позволенных несоответствий в выравнивании seed во время выравнивания мультиseed в виде 0 или 1.
Пример: 'NumSeedMismatches',1
Типы данных: double
NumThreads — Количество параллельных потоков, чтобы выполнить выравнивание (значение по умолчанию) | положительное целое числоКоличество параллельных потоков, чтобы выполнить выравнивание в виде положительного целого числа. Потоки работают на отдельных процессорах или ядрах. Увеличение числа потоков обеспечивает значительное увеличение скорости (близко к линейному), но также и увеличивает объем потребляемой памяти.
Пример: 'NumThreads',4
Типы данных: double
Offrate — Offrate, чтобы использовать при чтении индексаNaN (значение по умолчанию) | положительное целое числоOffrate, чтобы использовать при чтении индекса, чтобы уменьшать объем потребляемой памяти в виде положительного целого числа. offrate должен быть больше, offrate раньше создавал индекс.
Пример: 'Offrate',20
Типы данных: double
PadPositions — Положение в ссылочной последовательности, где выравнивание начинается (значение по умолчанию) | неотрицательное целое числоПоложение в ссылочной последовательности, где выравнивание для каждой последовательности начинается в виде неотрицательного целого числа.
Пример: 'PadPositions',10
Типы данных: double
ReadGapCosts — Разорвите затраты для открытия и расширения разрыва (значение по умолчанию) | двухэлементный вектор неотрицательных целых чиселРазорвите затраты для открытия и расширения разрыва на чтении в виде двухэлементного вектора неотрицательных целых чисел. Первым элементом является стоимость открытия разрыва, и вторым элементом является стоимость расширения разрыва. Учитывая вектор стоимости [GO GE]
, разрыв чтения длины N присвоен штраф GO + N * GE.
Пример: 'ReadGapCosts',[4 2]
Типы данных: double
ReadGroupID — Считайте ID группы, чтобы прибавить @RG линия заголовка'' (значение по умолчанию) | вектор символов | строкаСчитайте ID группы, чтобы прибавить @RG линия заголовка в выходе SAM сообщает в виде вектора символов или строки. Если вы задаете какой-либо ID группы чтения, функция распечатывает @RG линия заголовка с тегом ID: сопровождаемый заданным ID группы.
Пример: 'ReadGroupID','ID1'
Типы данных: char | string
ReadGroup — Считайте информации группы, чтобы добавить как поле на @RG линия заголовка'' (значение по умолчанию) | вектор символов | строкаСчитайте информации группы, чтобы добавить как поле на @RG линия заголовка в выходе SAM сообщает в виде вектора символов или строки. Это свойство применяется, только если вы задаете 'ReadGroupID'.
Пример: 'ReadGroup','Control'
Типы данных: char | string
RefGapCosts — Разорвите затраты для открытия и расширения разрыва (значение по умолчанию) | двухэлементный вектор неотрицательных целых чиселРазорвите затраты для открытия и расширения разрыва на ссылке в виде двухэлементного вектора неотрицательных целых чисел. Первым элементом является стоимость открытия разрыва, и вторым элементом является стоимость расширения разрыва. Учитывая вектор стоимости [GO GE]
, ссылочный разрыв длины N присвоен штраф GO + N * GE.
Пример: 'RefGapCosts',[4 2]
Типы данных: double
Reorder — Отметьте, чтобы переупорядочить записи SAMfalse (значение по умолчанию) | trueОтметьте, чтобы переупорядочить записи SAM, чтобы поддержать тот же порядок как во входных файлах в виде true или false. Это свойство применяется только, когда количество параллельных потоков больше того. Когда вы используете один поток, порядок записей в выходе совпадает с порядком входа.
Пример: 'Reorder',true
Типы данных: логический
Seed — Номер, чтобы установить seed в генераторе псевдослучайного числа (значение по умолчанию) | неотрицательное целое числоНомер, чтобы установить seed в генераторе псевдослучайного числа в виде неотрицательного целого числа.
Пример: 'Seed',3
Типы данных: double
SeedIntervalFunction — Управляющее расстояние функции между подстроками seedФункция, управляющая расстоянием между подстроками seed во время выравнивания мультиseed в виде вектора символов или строки.
Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:
'C'– Постоянный
'L'– Линейный
'S'– Квадратный корень
'G'– Естественный журнал
Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.
Для 'EndToEnd' режим выравнивания, функцией по умолчанию является 'S,1,1.15'. Для 'Local' режим, функцией по умолчанию является 'S,1,0.75'.
Пример: 'SeedIntervalFunction','S,2,2.15'
Типы данных: char | string
SeedLength — Отберите длину подстроки, чтобы выровняться во время выравнивания мультиseed (значение по умолчанию) | положительное целое числоОтберите длину подстроки, чтобы выровняться во время выравнивания мультиseed в виде положительного целого числа.
Пример: 'SeedLength',25
Типы данных: double
Skip — Количество чтений, чтобы проигнорировать (значение по умолчанию) | неотрицательное целое числоКоличество чтений, чтобы проигнорировать с начала входных файлов в виде неотрицательного целого числа.
Пример: 'Skip',5
Типы данных: double
Trim3 — Количество остатков, чтобы обрезать от 3' концов (значение по умолчанию) | неотрицательное целое числоКоличество остатков, чтобы обрезать от 3' концов каждого чтения прежде, чем выровняться в виде неотрицательного целого числа.
Пример: 'Trim3',5
Типы данных: double
Trim5 — Количество остатков, чтобы обрезать от 5' концов (значение по умолчанию) | неотрицательное целое числоКоличество остатков, чтобы обрезать от 5' концов каждого чтения прежде, чем выровняться в виде неотрицательного целого числа.
Пример: 'Trim5',5
Типы данных: double
UpTo — Количество чтений, чтобы рассмотреть с начала входных файловInf (значение по умолчанию) | положительное целое числоКоличество чтений, чтобы рассмотреть с начала входных файлов в виде положительного целого числа. Значением по умолчанию является Inf, то есть, все чтения рассматриваются.
Пример: 'UpTo',1000
Типы данных: double
getBowtie2Command | Переведите свойства объектов в Галстук-бабочку 2 опции |
getBowtie2Table | Получите таблицу со свойствами объектов и эквивалентным Галстуком-бабочкой 2 опции |
preset | Установите комбинацию опций выравнивания |
run | Сопоставьте чтения последовательности со ссылочной последовательностью с помощью Галстука-бабочки 2 |
Создайте набор индексных файлов для генома Дрозофилы. Сообщение об ошибке появляется, если у вас нет Интерфейса Bioinformatics Toolbox для пакета поддержки Выравнивателя Галстука-бабочки установленным, когда вы запускаете функцию. Щелкните по обеспеченной ссылке, чтобы загрузить пакет с меню Дополнения.
В данном примере ссылочная последовательность Dmel_chr4.fa уже предоставлен тулбокс.
status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');
Если сборка индекса успешна, функция возвращает 0 и создает индексные файлы (*.bt2) в текущей папке. Файлы имеют префиксный 'Dmel_chr4_index'.
Иногда индексные файлы существуют, и вы хотите знать, что ссылочная последовательность раньше создавала индекс. В этом случае используйте bowtie2inspect функция, чтобы получить больше информации о ссылке.
bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');
По умолчанию, выходной файл Dmel_chr4_retrieved.fa содержит последовательность ссылки. Можно также получить итоговую информацию о ссылочном имени и длинах вместо фактической последовательности. Для получения дополнительной информации на доступных параметрах, смотрите Bowtie2InspectOptions.
Если индекс готов, сопоставьте последовательности чтения со ссылкой с помощью bowtie2 функция. Парный конец считал файлы (SRR6008575_10k_1.fq и SRR6008575_10k_2.fq) уже предоставлены тулбокс.
bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');
Выход является SAM-отформатированным файлом, который содержит результаты отображения.
Можно задать различные опции выравнивания путем передачи в Галстуке-бабочке 2 строк синтаксиса или использования Bowtie2AlignOptions объект.
Предположим, что вы хотите обрезать некоторые остатки от 3' закончите перед выравниванием. Во-первых, создайте Bowtie2AlignOptions объект.
alignOpt = Bowtie2AlignOptions;
Обрежьте четыре остатка от 3' закончите перед выравниванием.
alignOpt.Trim3 = 4;
Сопоставьте чтения со ссылкой с помощью заданной опции выравнивания.
flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);
[1] Langmead, B. и С. Залцберг. "Быстро содержащий разрывы считанное выравнивание с Галстуком-бабочкой 2". Методы природы. 9, 2012, 357–359.
Bowtie2AlignOptions | Bowtie2BuildOptions | Bowtie2InspectOptions | bowtie2 | bowtie2build | bowtie2inspect
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.