Bowtie2AlignOptions

Опции, чтобы сопоставить чтения со ссылочной последовательностью

Описание

Bowtie2AlignOptions объект содержит опции, чтобы запуститься bowtie2 функция, которая выравнивает чтения к ссылочной последовательности.

Создание

Описание

пример

alignOptions = Bowtie2AlignOptions создает Bowtie2AlignOptions объект со значениями свойств по умолчанию.

Bowtie2AlignOptions требует Интерфейса Bioinformatics Toolbox™ для Выравнивателя Галстука-бабочки. Если этот пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты Программной поддержки Bioinformatics Toolbox.

Примечание

Bowtie2AlignOptions поддерживается на Mac и UNIX® платформы только.

пример

alignOptions = Bowtie2AlignOptions(Name,Value) свойства наборов с помощью одного или нескольких аргументов пары "имя-значение". Заключите каждое имя свойства в кавычки. Например, alignOptions = Bowtie2AlignOptions('Trim5',10) задает, чтобы обрезать 10 остатков от 5' концов.

пример

alignOptions = Bowtie2AlignOptions(S) задает дополнительные параметры в векторе символов S.

Входные параметры

развернуть все

Параметры выравнивания в виде вектора символов. S должны быть в Галстуке-бабочке 2 синтаксиса опции (снабженный префиксом одним или двумя тире) [1].

Свойства

развернуть все

Отметьте, чтобы позволить настройки ласточкиного хвоста в виде true или false. Это свойство задает, может ли выравнивание одного помощника расширить мимо начала выравнивания другого помощника и быть рассмотрено согласующееся.

Это свойство применяется к чтениям парного конца только.

Пример: 'AllowDovetail',true

Типы данных: логический

Штраф за положения с неоднозначными символами на последовательности чтения, ссылочной последовательности или обоих в виде неотрицательного целого числа.

Пример: 'AmbiguousPenalty',2

Типы данных: double

Формат кодировки основного качества во входных файлах в виде одного из следующего: 'Phred33', 'Phred64', или 'Solexa'.

Пример: 'Encoding','Phred64'

Типы данных: char | string

Отметьте, чтобы позволить одному выравниванию помощника содержать выравнивание другого помощника и рассматриваться согласующимся в виде true или false.

Это свойство применяется к чтениям парного конца только.

Пример: 'ExcludeContain',true

Типы данных: логический

Отметьте, чтобы включать противоречащие выравнивания в виде true или false. Противоречащее выравнивание является выравниванием, где оба помощника выравниваются исключительно, но не способом, который удовлетворяет ограничениям парного конца.

Пример: 'ExcludeDiscordant',true

Типы данных: логический

Отметьте, чтобы исключить смешанные выравнивания в виде true или false. Смешанное выравнивание состоит из чтений помощника, которые не являются согласующимися или противоречащими, но выравниваются индивидуально.

Это свойство применяется к чтениям парного конца только.

Пример: 'ExcludeMixed',true

Типы данных: логический

Отметьте, чтобы позволить выравниванию одного помощника перекрываться с выравниванием другого помощника и рассматриваться согласующимся в виде true или false.

Пример: 'ExcludeOverlap',true

Типы данных: логический

Отметьте, чтобы исключить чтения, которым не удалось выровняться в виде true или false.

Пример: 'ExcludeUnaligned',true

Типы данных: логический

Дополнительные опции, не включенные в свойства объектов в виде вектора символов. Вектор символов должен быть в Галстуке-бабочке 2 синтаксисами опции (снабженный префиксом одним или двумя тире). Значением по умолчанию является пустой символьный вектор ''.

Пример: 'ExtraBowtie2Command','--version'

Типы данных: char | string

Отметьте, чтобы проигнорировать фактическое качество положения чтения, когда несоответствие произойдет в виде true или false. Установка этого свойства к true позволяет качественному значению в том несовпадающем положении быть максимально возможным, независимо от фактического значения.

Пример: 'IgnoreQuality',true

Типы данных: логический

Вознаграждение, добавленное к выравниванию, выигрывает, когда положение в чтении совпадает с положением в ссылке в виде неотрицательного целого числа.

Пример: 'MatchBonus',5

Типы данных: double

Функция, управляющая максимальным количеством неоднозначных символов, позволенных в чтении в виде вектора символов или строки.

Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:

  • 'C'– Постоянный

  • 'L'– Линейный

  • 'S'– Квадратный корень

  • 'G'– Естественный журнал

Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.

Функцией по умолчанию является 'L,0,0.15', то есть, H(x) = 0 + 0.15 * x.

Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'

Типы данных: char | string

Отметьте, чтобы использовать размещение в ОЗУ (вместо файлового ввода-вывода) при загрузке индекса в виде true или false. Размещение в ОЗУ позволяет многим параллельным процессам совместно использовать отображение памяти индекса, приводящего к более эффективному распараллеливанию задачи.

Пример: 'MemoryMappedIndex',true

Типы данных: логический

Функция, управляющая минимальным порогом счета выравнивания в виде вектора символов или строки.

Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:

  • 'C'– Постоянный

  • 'L'– Линейный

  • 'S'– Квадратный корень

  • 'G'– Естественный журнал

Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.

Для 'EndToEnd' режим выравнивания, функцией по умолчанию является 'L,-0.6,-0.6'. Для 'Local' режим, функцией по умолчанию является 'G,20,8'.

Пример: 'MinScoreFunction','L,-0.4,-0.6'

Типы данных: char | string

Максимальные и минимальные значения, чтобы вычислить штраф несоответствия во время выравнивания в виде двухэлементного вектора. Первым элементом является максимальное значение, и вторым элементом является минимальное значение.

Номер, меньше чем или равный максимальному значению и больше, чем или равный минимальному значению, вычтен из счета выравнивания к каждому положению, где символ чтения выравнивается к ссылочному символу, символы не соответствуют, и ни один не N символ.

Пример: 'MismatchPenalty',[5 3]

Типы данных: double

Режим Alignment в виде 'EndToEnd' или 'Local'.

В 'Local' режим, только часть чтения должна выровняться к ссылке, и некоторые остатки могут быть не использованы (мягко отсеченные), чтобы достигнуть лучшего счета выравнивания. В 'EndToEnd' режим, целое чтение должно выровняться без любого мягкого усечения.

Пример: 'Mode','Local'

Типы данных: char | string

Отметьте, чтобы повторно инициализировать псевдослучайный генератор для каждого чтения с помощью текущего времени в виде true или false. Если true, выравнивания, о которых сообщают для двух идентичных чтений, могут отличаться. Значением по умолчанию является false, то есть, псевдослучайный генератор повторно инициализируется с помощью seed, выведенного из считанных информаций и номера seed.

Пример: 'Nondeterministic',true

Типы данных: логический

Количество положений вначале или конца каждого чтения, где разрывы не позволены в виде неотрицательного целого числа.

Пример: 'NoGapPositions',5

Типы данных: double

Максимальное количество допустимых выравниваний, чтобы сообщить прежде, чем отключить поиск в виде положительного целого числа, 'Best', или 'All'. Если вы задаете положительный целочисленный N, функция ищет до N отличные, допустимые выравнивания для каждого чтения. 'Best' сообщает лучшее выравнивание для каждого чтения. 'All' отчеты все допустимые выравнивания для каждого чтения отсортированы по баллам выравнивания.

Счет выравнивания к выравниванию парного конца равняется сумме множества выравнивания отдельных помощников.

Пример: 'NumAlignments','All'

Типы данных: double | char | string

Максимальное количество пересева попыток с повторяющимися seed в виде неотрицательного целого числа. Во время пересева функция выбирает новый набор чтений при различных смещениях, чтобы найти больше выравниваний.

Пример: 'NumReseedings',5

Типы данных: double

Максимальное количество последовательных попыток расширения seed прежде, чем получить новый seed в виде неотрицательного целого числа. Расширение seed перестало работать, если оно не дает к выравниванию с лучшим (или второсортный) счет.

Пример: 'NumSeedExtensions',10

Типы данных: double

Количество позволенных несоответствий в выравнивании seed во время выравнивания мультиseed в виде 0 или 1.

Пример: 'NumSeedMismatches',1

Типы данных: double

Количество параллельных потоков, чтобы выполнить выравнивание в виде положительного целого числа. Потоки работают на отдельных процессорах или ядрах. Увеличение числа потоков обеспечивает значительное увеличение скорости (близко к линейному), но также и увеличивает объем потребляемой памяти.

Пример: 'NumThreads',4

Типы данных: double

Offrate, чтобы использовать при чтении индекса, чтобы уменьшать объем потребляемой памяти в виде положительного целого числа. offrate должен быть больше, offrate раньше создавал индекс.

Пример: 'Offrate',20

Типы данных: double

Положение в ссылочной последовательности, где выравнивание для каждой последовательности начинается в виде неотрицательного целого числа.

Пример: 'PadPositions',10

Типы данных: double

Разорвите затраты для открытия и расширения разрыва на чтении в виде двухэлементного вектора из неотрицательных целых чисел. Первым элементом является стоимость открытия разрыва, и вторым элементом является стоимость расширения разрыва. Учитывая вектор стоимости [GO GE] , разрыв чтения длины N присвоен штраф GO + N * GE.

Пример: 'ReadGapCosts',[4 2]

Типы данных: double

Считайте ID группы, чтобы прибавить @RG линия заголовка в выходе SAM сообщает в виде вектора символов или строки. Если вы задаете какой-либо ID группы чтения, функция распечатывает @RG линия заголовка с тегом ID: сопровождаемый заданным ID группы.

Пример: 'ReadGroupID','ID1'

Типы данных: char | string

Считайте информации группы, чтобы добавить как поле на @RG линия заголовка в выходе SAM сообщает в виде вектора символов или строки. Это свойство применяется, только если вы задаете 'ReadGroupID'.

Пример: 'ReadGroup','Control'

Типы данных: char | string

Разорвите затраты для открытия и расширения разрыва на ссылке в виде двухэлементного вектора из неотрицательных целых чисел. Первым элементом является стоимость открытия разрыва, и вторым элементом является стоимость расширения разрыва. Учитывая вектор стоимости [GO GE] , ссылочный разрыв длины N присвоен штраф GO + N * GE.

Пример: 'RefGapCosts',[4 2]

Типы данных: double

Отметьте, чтобы переупорядочить записи SAM, чтобы поддержать тот же порядок как во входных файлах в виде true или false. Это свойство применяется только, когда количество параллельных потоков больше того. Когда вы используете один поток, порядок записей в выходе совпадает с порядком входа.

Пример: 'Reorder',true

Типы данных: логический

Номер, чтобы установить seed в генераторе псевдослучайного числа в виде неотрицательного целого числа.

Пример: 'Seed',3

Типы данных: double

Функция, управляющая расстоянием между подстроками seed во время выравнивания мультиseed в виде вектора символов или строки.

Функция имеет формат 'f,B,A', где f является функциональным типом, B является постоянным термином, и A является коэффициентом. Доступные функциональные типы:

  • 'C'– Постоянный

  • 'L'– Линейный

  • 'S'– Квадратный корень

  • 'G'– Естественный журнал

Получившейся функцией является H(x) = B + A * f(x), где x является продолжительностью чтения.

Для 'EndToEnd' режим выравнивания, функцией по умолчанию является 'S,1,1.15'. Для 'Local' режим, функцией по умолчанию является 'S,1,0.75'.

Пример: 'SeedIntervalFunction','S,2,2.15'

Типы данных: char | string

Отберите длину подстроки, чтобы выровняться во время выравнивания мультиseed в виде положительного целого числа.

Пример: 'SeedLength',25

Типы данных: double

Количество чтений, чтобы проигнорировать с начала входных файлов в виде неотрицательного целого числа.

Пример: 'Skip',5

Типы данных: double

Количество остатков, чтобы обрезать от 3' концов каждого чтения прежде, чем выровняться в виде неотрицательного целого числа.

Пример: 'Trim3',5

Типы данных: double

Количество остатков, чтобы обрезать от 5' концов каждого чтения прежде, чем выровняться в виде неотрицательного целого числа.

Пример: 'Trim5',5

Типы данных: double

Количество чтений, чтобы рассмотреть с начала входных файлов в виде положительного целого числа. Значением по умолчанию является Inf, то есть, все чтения рассматриваются.

Пример: 'UpTo',1000

Типы данных: double

Функции объекта

getBowtie2CommandПереведите свойства объектов в Галстук-бабочку 2 опции
getBowtie2TableПолучите таблицу со свойствами объектов и эквивалентным Галстуком-бабочкой 2 опции
presetУстановите комбинацию опций выравнивания
runСопоставьте чтения последовательности со ссылочной последовательностью с помощью Галстука-бабочки 2

Примеры

свернуть все

Создайте набор индексных файлов для генома Дрозофилы. Сообщение об ошибке появляется, если у вас нет Интерфейса Bioinformatics Toolbox для пакета поддержки Выравнивателя Галстука-бабочки установленным, когда вы запускаете функцию. Щелкните по обеспеченной ссылке, чтобы загрузить пакет с меню Дополнения.

В данном примере ссылочная последовательность Dmel_chr4.fa уже предоставлен тулбокс.

status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');

Если сборка индекса успешна, функция возвращает 0 и создает индексные файлы (*.bt2) в текущей папке. Файлы имеют префиксный 'Dmel_chr4_index'.

Иногда индексные файлы существуют, и вы хотите знать, что ссылочная последовательность раньше создавала индекс. В этом случае используйте bowtie2inspect функция, чтобы получить больше информации о ссылке.

bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');

По умолчанию, выходной файл Dmel_chr4_retrieved.fa содержит последовательность ссылки. Можно также получить итоговую информацию о ссылочном имени и длинах вместо фактической последовательности. Для получения дополнительной информации на доступных параметрах, смотрите Bowtie2InspectOptions.

Если индекс готов, сопоставьте последовательности чтения со ссылкой с помощью bowtie2 функция. Парный конец считал файлы (SRR6008575_10k_1.fq и SRR6008575_10k_2.fq) уже предоставлены тулбокс.

bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');

Выход является SAM-отформатированным файлом, который содержит результаты отображения.

Можно задать различные опции выравнивания путем передачи в Галстуке-бабочке 2 строк синтаксиса или использования Bowtie2AlignOptions объект.

Предположим, что вы хотите обрезать некоторые остатки от 3' закончите перед выравниванием. Во-первых, создайте Bowtie2AlignOptions объект.

 alignOpt = Bowtie2AlignOptions;

Обрежьте четыре остатка от 3' закончите перед выравниванием.

 alignOpt.Trim3 = 4;

Сопоставьте чтения со ссылкой с помощью заданной опции выравнивания.

flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);

Ссылки

[1] Langmead, B. и С. Залцберг. "Быстро содержащий разрывы считанное выравнивание с Галстуком-бабочкой 2". Методы природы. 9, 2012, 357–359.

Введенный в R2018a