Bowtie2AlignOptions

Опции, чтобы сопоставить чтения со ссылочной последовательностью

Описание

Bowtie2AlignOptions объект содержит опции, чтобы запустить bowtie2 функция, которая выравнивает чтения к ссылочной последовательности.

Создание

Описание

пример

alignOptions = Bowtie2AlignOptions создает Bowtie2AlignOptions объект со значениями свойств по умолчанию.

Bowtie2AlignOptions требует Интерфейса Bioinformatics Toolbox™ для пакета поддержки Выравнивателя Галстука-бабочки. Если этот пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.

Примечание

Bowtie2AlignOptions поддерживается на Mac и платформах UNIX® только.

пример

alignOptions = Bowtie2AlignOptions(Name,Value) свойства наборов с помощью одного или нескольких аргументов пары "имя-значение". Заключите каждое имя свойства в кавычки. Например, alignOptions = Bowtie2AlignOptions('Trim5',10) задает, чтобы обрезать 10 остатков от 5' концов.

пример

alignOptions = Bowtie2AlignOptions(S) задает дополнительные параметры в векторе символов S.

Входные параметры

развернуть все

Параметры выравнивания, заданные как вектор символов. S должны быть в Галстуке-бабочке 2 синтаксиса опции (снабженный префиксом одним или двумя тире) [1].

Свойства

развернуть все

Отметьте, чтобы позволить настройки ласточкиного хвоста, заданные как true или false. Это свойство задает, может ли выравнивание одного помощника расширить мимо начала выравнивания другого помощника и быть рассмотрено согласующееся.

Это свойство применяется к чтениям парного конца только.

Пример: 'AllowDovetail',true

Типы данных: логический

Штраф за положения с неоднозначными символами на последовательности чтения, ссылочной последовательности или обоих, заданных как неотрицательное целое число.

Пример: 'AmbiguousPenalty',2

Типы данных: double

Формат кодировки основного качества во входных файлах, заданных как одно из следующего: 'Phred33', 'Phred64', или 'Solexa'.

Пример: 'Encoding','Phred64'

Типы данных: char | string

Отметьте, чтобы позволить одному выравниванию помощника содержать выравнивание другого помощника и рассматриваться согласующимся, задаваться как true или false.

Это свойство применяется к чтениям парного конца только.

Пример: 'ExcludeContain',true

Типы данных: логический

Отметьте, чтобы включать противоречащие выравнивания, заданные как true или false. Противоречащее выравнивание является выравниванием, где оба помощника выравниваются исключительно, но не способом, который удовлетворяет ограничениям парного конца.

Пример: 'ExcludeDiscordant',true

Типы данных: логический

Отметьте, чтобы исключить смешанные выравнивания, заданные как true или false. Смешанное выравнивание состоит из чтений помощника, которые не являются согласующимися или противоречащими, но выравниваются индивидуально.

Это свойство применяется к чтениям парного конца только.

Пример: 'ExcludeMixed',true

Типы данных: логический

Отметьте, чтобы позволить выравниванию одного помощника накладываться с выравниванием другого помощника и рассматриваться согласующимся, задаваться как true или false.

Пример: 'ExcludeOverlap',true

Типы данных: логический

Отметьте, чтобы исключить чтения, которым не удалось выровняться, заданный как true или false.

Пример: 'ExcludeUnaligned',true

Типы данных: логический

Дополнительные опции, не включенные в свойства объектов, заданные как вектор символов. Вектор символов должен быть в Галстуке-бабочке 2 синтаксисами опции (снабженный префиксом одним или двумя тире). Значением по умолчанию является пустой символьный вектор ''.

Пример: 'ExtraBowtie2Command','--version'

Типы данных: char | string

Отметьте, чтобы проигнорировать фактическое качество положения чтения, когда несоответствие произойдет, заданное как true или false. Установка этого свойства к true позволяет качественному значению в том несовпадающем положении быть максимально возможным, независимо от фактического значения.

Пример: 'IgnoreQuality',true

Типы данных: логический

Вознаграждение, добавленное к выравниванию, выигрывает, когда положение в чтении совпадает с положением в ссылке, заданной как неотрицательное целое число.

Пример: 'MatchBonus',5

Типы данных: double

Функция, управляющая максимальным количеством неоднозначных символов, позволенных в чтении, заданном как вектор символов или строка.

Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:

  • 'C'– Постоянный

  • 'L'– Линейный

  • 'S'– Квадратный корень

  • 'G'– Естественный журнал

Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.

Функцией по умолчанию является 'L,0,0.15', то есть, H(x) = 0 + 0.15 * x.

Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'

Типы данных: char | string

Отметьте, чтобы использовать размещение в ОЗУ (вместо файлового ввода-вывода) при загрузке индекса, заданного как true или false. Размещение в ОЗУ позволяет многим параллельным процессам совместно использовать отображение памяти индекса, приводящего к более эффективному распараллеливанию задачи.

Пример: 'MemoryMappedIndex',true

Типы данных: логический

Функция, управляющая минимальным порогом счета выравнивания, заданного как вектор символов или строка.

Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:

  • 'C'– Постоянный

  • 'L'– Линейный

  • 'S'– Квадратный корень

  • 'G'– Естественный журнал

Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.

Для 'EndToEnd' режим выравнивания, функцией по умолчанию является 'L,-0.6,-0.6'. Для 'Local' режим, функцией по умолчанию является 'G,20,8'.

Пример: 'MinScoreFunction','L,-0.4,-0.6'

Типы данных: char | string

Максимальные и минимальные значения, чтобы вычислить штраф несоответствия во время выравнивания, заданного как двухэлементный вектор. Первый элемент является максимальным значением, и второй элемент является минимальным значением.

Номер, меньше чем или равный максимальному значению и больше, чем или равный минимальному значению, вычтен из счета выравнивания к каждому положению, где символ чтения выравнивается к ссылочному символу, символы не соответствуют, и ни один не N символ.

Пример: 'MismatchPenalty',[5 3]

Типы данных: double

Режим Alignment, заданный как 'EndToEnd' или 'Local'.

В 'Local' режим, только часть чтения должна выровняться к ссылке, и некоторые остатки могут быть не использованы (мягко отсеченные), чтобы достигнуть лучшего счета выравнивания. В 'EndToEnd' режим, целое чтение должно выровняться без любого мягкого усечения.

Пример: 'Mode','Local'

Типы данных: char | string

Отметьте, чтобы повторно инициализировать псевдослучайный генератор для каждого чтения с помощью текущего времени, заданного как true или false. Если true, выравнивания, о которых сообщают для двух идентичных чтений, могут отличаться. Значением по умолчанию является false, то есть, псевдослучайный генератор повторно инициализируется с помощью seed, выведенного из считанных информаций и номера seed.

Пример: 'Nondeterministic',true

Типы данных: логический

Количество положений вначале или конца каждого чтения, где разрывы не позволены, задало как неотрицательное целое число.

Пример: 'NoGapPositions',5

Типы данных: double

Максимальное количество допустимых выравниваний, чтобы сообщить прежде, чем отключить поиск, заданный как положительное целое число, 'Best', или 'All'. Если вы задаете положительный целочисленный N, функция ищет до N отличные, допустимые выравнивания для каждого чтения. 'Best' сообщает лучшее выравнивание для каждого чтения. 'All' отчеты все допустимые выравнивания для каждого чтения отсортированы по баллам выравнивания.

Счет выравнивания к выравниванию парного конца равняется сумме множества выравнивания отдельных помощников.

Пример: 'NumAlignments','All'

Типы данных: double | char | string

Максимальное количество пересева попыток с повторяющимися seed, заданными как неотрицательное целое число. Во время пересева функция выбирает новый набор чтений при различных смещениях, чтобы найти больше выравниваний.

Пример: 'NumReseedings',5

Типы данных: double

Максимальное количество последовательных попыток расширения seed прежде, чем получить новый seed, заданный как неотрицательное целое число. Расширение seed перестало работать, если оно не дает к выравниванию с лучшим (или второсортный) счет.

Пример: 'NumSeedExtensions',10

Типы данных: double

Количество позволенных несоответствий в выравнивании seed во время выравнивания мультиseed, заданного как 0 или 1.

Пример: 'NumSeedMismatches',1

Типы данных: double

Количество параллельных потоков, чтобы выполнить выравнивание, заданное как положительное целое число. Потоки работают на отдельных процессорах или ядрах. Увеличение числа потоков обеспечивает значительное увеличение скорости (близко к линейному), но также и увеличивает объем потребляемой памяти.

Пример: 'NumThreads',4

Типы данных: double

Offrate, чтобы использовать при чтении индекса, чтобы уменьшать объем потребляемой памяти, заданный как положительное целое число. offrate должен быть больше, offrate раньше создавал индекс.

Пример: 'Offrate',20

Типы данных: double

Положение в ссылочной последовательности, где выравнивание для каждой последовательности начинается, заданный как неотрицательное целое число.

Пример: 'PadPositions',10

Типы данных: double

Разорвите затраты для открытия и расширения разрыва на чтении, заданном как двухэлементный вектор неотрицательных целых чисел. Первый элемент является стоимостью открытия разрыва, и второй элемент является стоимостью расширения разрыва. Учитывая вектор стоимости [GO GE] , разрыв чтения длины N присвоен штраф GO + N * GE.

Пример: 'ReadGapCosts',[4 2]

Типы данных: double

Считайте ID группы, чтобы прибавить @RG линия заголовка в отчете выхода SAM, заданном как вектор символов или строка. Если вы задаете какой-либо ID группы чтения, функция распечатывает @RG линия заголовка с тегом ID: сопровождаемый заданным ID группы.

Пример: 'ReadGroupID','ID1'

Типы данных: char | string

Считайте информации группы, чтобы добавить как поле на @RG линия заголовка в отчете выхода SAM, заданном как вектор символов или строка. Это свойство применяется, только если вы задаете 'ReadGroupID'.

Пример: 'ReadGroup','Control'

Типы данных: char | string

Разорвите затраты для открытия и расширения разрыва на ссылке, заданной как двухэлементный вектор неотрицательных целых чисел. Первый элемент является стоимостью открытия разрыва, и второй элемент является стоимостью расширения разрыва. Учитывая вектор стоимости [GO GE] , ссылочный разрыв длины N присвоен штраф GO + N * GE.

Пример: 'RefGapCosts',[4 2]

Типы данных: double

Отметьте, чтобы переупорядочить записи SAM, чтобы поддержать тот же порядок как во входных файлах, заданных как true или false. Это свойство применяется только, когда количество параллельных потоков больше того. Когда вы используете один поток, порядок записей в выходе совпадает с порядком входа.

Пример: 'Reorder',true

Типы данных: логический

Номер, чтобы установить seed в генераторе псевдослучайного числа, заданном как неотрицательное целое число.

Пример: 'Seed',3

Типы данных: double

Функция, управляющая расстоянием между подстроками seed во время выравнивания мультиseed, заданного как вектор символов или строка.

Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:

  • 'C'– Постоянный

  • 'L'– Линейный

  • 'S'– Квадратный корень

  • 'G'– Естественный журнал

Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.

Для 'EndToEnd' режим выравнивания, функцией по умолчанию является 'S,1,1.15'. Для 'Local' режим, функцией по умолчанию является 'S,1,0.75'.

Пример: 'SeedIntervalFunction','S,2,2.15'

Типы данных: char | string

Отберите длину подстроки, чтобы выровняться во время выравнивания мультиseed, заданного как положительное целое число.

Пример: 'SeedLength',25

Типы данных: double

Количество чтений, чтобы проигнорировать с начала входных файлов, заданных как неотрицательное целое число.

Пример: 'Skip',5

Типы данных: double

Количество остатков, чтобы обрезать от 3' концов каждого чтения перед выравниванием, заданным как неотрицательное целое число.

Пример: 'Trim3',5

Типы данных: double

Количество остатков, чтобы обрезать от 5' концов каждого чтения перед выравниванием, заданным как неотрицательное целое число.

Пример: 'Trim5',5

Типы данных: double

Количество чтений, чтобы рассмотреть с начала входных файлов, заданных как положительное целое число. Значением по умолчанию является Inf, то есть, все чтения рассматриваются.

Пример: 'UpTo',1000

Типы данных: double

Функции объекта

getBowtie2CommandПереведите свойства объектов в Галстук-бабочку 2 опции
getBowtie2TableПолучите таблицу со свойствами объектов и эквивалентным Галстуком-бабочкой 2 опции
presetУстановите комбинацию опций выравнивания
runСопоставьте чтения последовательности со ссылочной последовательностью с помощью Галстука-бабочки 2

Примеры

свернуть все

Создайте набор индексных файлов для генома Дрозофилы. Сообщение об ошибке появляется, если у вас нет Интерфейса Bioinformatics Toolbox для пакета поддержки Выравнивателя Галстука-бабочки установленным, когда вы запускаете функцию. Щелкните по обеспеченной ссылке, чтобы загрузить пакет с меню Дополнения.

В данном примере ссылочная последовательность Dmel_chr4.fa уже предоставлен тулбокс.

status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');

Если сборка индекса успешна, функция возвращает 0 и создает индексные файлы (*.bt2) в текущей папке. Файлы имеют префиксный 'Dmel_chr4_index'.

Иногда индексные файлы существуют, и вы хотите знать, что ссылочная последовательность раньше создавала индекс. В этом случае используйте bowtie2inspect функция, чтобы получить больше информации о ссылке.

bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');

По умолчанию, выходной файл Dmel_chr4_retrieved.fa содержит последовательность ссылки. Можно также получить итоговую информацию о ссылочном имени и длинах вместо фактической последовательности. Для получения дополнительной информации на доступных параметрах, смотрите Bowtie2InspectOptions.

Если индекс готов, сопоставьте последовательности чтения со ссылкой с помощью bowtie2 функция. Парный конец считал файлы (SRR6008575_10k_1.fq и SRR6008575_10k_2.fq) уже предоставлены тулбокс.

bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');

Выход является SAM-отформатированным файлом, который содержит результаты отображения.

Можно задать различные опции выравнивания путем передачи в Галстуке-бабочке 2 строк синтаксиса или использования Bowtie2AlignOptions объект.

Предположим, что вы хотите обрезать некоторые остатки от 3' закончите перед выравниванием. Во-первых, создайте Bowtie2AlignOptions объект.

 alignOpt = Bowtie2AlignOptions;

Обрежьте четыре остатка от 3' закончите перед выравниванием.

 alignOpt.Trim3 = 4;

Сопоставьте чтения со ссылкой с помощью заданной опции выравнивания.

flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);

Ссылки

[1] Langmead, B. и С. Залцберг. "Быстро содержащий разрывы считанное выравнивание с Галстуком-бабочкой 2". Методы природы. 9, 2012, 357–359.

Введенный в R2018a

Для просмотра документации необходимо авторизоваться на сайте