Bowtie2AlignOptions

Опции для сопоставления чтения с ссылочной последовательностью

Описание

A Bowtie2AlignOptions объект содержит опции, чтобы запустить bowtie2 функция, которая выравнивается по значению в ссылочной последовательности.

Создание

Описание

пример

alignOptions = Bowtie2AlignOptions создает Bowtie2AlignOptions объект со значениями свойств по умолчанию.

Bowtie2AlignOptions требуется интерфейс Bioinformatics Toolbox™ для Bowtie Aligner. Если этот пакет поддержки не установлен, то функция предоставляет ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.

Примечание

Bowtie2AlignOptions поддерживается в Mac и UNIX® только платформы.

пример

alignOptions = Bowtie2AlignOptions(Name,Value) устанавливает свойства с помощью одного или нескольких аргументов пары "имя-значение". Заключайте каждое имя свойства в кавычки. Для примера, alignOptions = Bowtie2AlignOptions('Trim5',10) задает, чтобы отсечь 10 остатков от 5 '-конца.

пример

alignOptions = Bowtie2AlignOptions(S) задает необязательные параметры в вектор символов S.

Входные параметры

расширить все

Параметры выравнивания, заданные как вектор символов. S должен находиться в синтаксисе опции Bowtie 2 (с префиксом одной или двух штрихов) [1].

Свойства

расширить все

Флаг для разрешения строений dovetail, заданный как true или false. Это свойство определяет, может ли выравнивание одного сопрягаемого элемента продолжаться мимо начала выравнивания другого сопрягаемого элемента и считаться согласованным.

Это свойство применяется только к чтению в парном конце.

Пример: 'AllowDovetail',true

Типы данных: logical

Штраф за положения с неоднозначными символами в последовательности чтения, ссылочной последовательности или обоих в виде неотрицательного целого числа.

Пример: 'AmbiguousPenalty',2

Типы данных: double

Формат кодировки базового качества в файлах входа, заданный как один из следующих: 'Phred33', 'Phred64', или 'Solexa'.

Пример: 'Encoding','Phred64'

Типы данных: char | string

Флаг, позволяющий одному сопряженному выравниванию содержать выравнивание другого сопряженного соединения и считаться согласованным, заданным как true или false.

Это свойство применяется только к чтению в парном конце.

Пример: 'ExcludeContain',true

Типы данных: logical

Флаг, включающий несоответствующие выравнивания, заданный как true или false. Несоответствующее выравнивание является выравниванием, где оба пары выравниваются уникально, но не таким образом, чтобы удовлетворять ограничениям парного конца.

Пример: 'ExcludeDiscordant',true

Типы данных: logical

Флаг для исключения смешанных выравниваний, заданный как true или false. Смешанное выравнивание состоит из сопутствующих чтений, которые не являются согласованными или несоответствующими, но выравниваются по отдельности.

Это свойство применяется только к чтению в парном конце.

Пример: 'ExcludeMixed',true

Типы данных: logical

Флаг, позволяющий совмещению одного сопряжения перекрывать с выравниванием другого сопряжения и считаться согласованным, заданный как true или false.

Пример: 'ExcludeOverlap',true

Типы данных: logical

Флаг для исключения показаний, которые не удалось выровнять, заданный как true или false.

Пример: 'ExcludeUnaligned',true

Типы данных: logical

Дополнительные опции, не включенные в свойства объекта, заданные как вектор символов. Вектор символов должен быть в синтаксисе опции Bowtie 2 (с префиксом одной или двух штрихов). Значение по умолчанию является пустым символьным вектором ''.

Пример: 'ExtraBowtie2Command','--version'

Типы данных: char | string

Флаг для игнорирования фактического качества позиции чтения при возникновении несоответствия, заданный как true или false. Установка значения свойства true позволяет, чтобы значение качества в этом несоответствующем положении было максимально возможным, независимо от фактического значения.

Пример: 'IgnoreQuality',true

Типы данных: logical

Вознаграждение, добавленное к счету выравнивания, когда положение в считанном значении совпадает с положением в ссылке, заданным как неотрицательное целое число.

Пример: 'MatchBonus',5

Типы данных: double

Функция, определяющая максимальное количество неоднозначных символов, разрешенных в считывании, заданных в виде вектора символов или строки.

Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:

  • 'C'- Константа

  • 'L'- Линейный

  • 'S'- Квадратный корень

  • 'G'- Естественный журнал

Получившаяся функция H(x) = B + A * f(x), где x - длина чтения.

Функция по умолчанию 'L,0,0.15', то есть H(x) = 0 + 0.15 * x.

Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'

Типы данных: char | string

Флаг для использования размещения в ОЗУ (вместо файловых вводов-выводов) при загрузке индекса, заданный как true или false. Размещение в ОЗУ позволяет многим параллельным процессам совместно использовать изображение памяти индекса, что приводит к более эффективной параллелизации задачи.

Пример: 'MemoryMappedIndex',true

Типы данных: logical

Функция, определяющая минимальный порог счета выравнивания, заданный как вектор символов или строка.

Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:

  • 'C'- Константа

  • 'L'- Линейный

  • 'S'- Квадратный корень

  • 'G'- Естественный журнал

Получившаяся функция H(x) = B + A * f(x), где x - длина чтения.

Для 'EndToEnd' режим выравнивания, функция по умолчанию 'L,-0.6,-0.6'. Для 'Local' mode, функция по умолчанию 'G,20,8'.

Пример: 'MinScoreFunction','L,-0.4,-0.6'

Типы данных: char | string

Максимальное и минимальное значения для вычисления штрафа за несоответствие во время выравнивания, заданные как двухэлементный вектор. Первый элемент является максимальным значением, а второй элемент - минимальным значением.

Число, меньше чем или равное максимальному значению и больше чем или равное минимальному значению, вычитается из счета выравнивания для каждой позиции, где считанный символ выравнивается к ссылке символу, символы не совпадают, и не является N символ.

Пример: 'MismatchPenalty',[5 3]

Типы данных: double

Режим выравнивания, заданный как 'EndToEnd' или 'Local'.

В 'Local' mode, только часть чтения должна выровняться по ссылке, и некоторые остатки могут быть опущены (мягко отсечены), чтобы достичь наилучшего счета выравнивания. В 'EndToEnd' режим, все чтение должно выровняться без каких-либо мягких отсечек.

Пример: 'Mode','Local'

Типы данных: char | string

Флаг для повторной инициализации псевдослучайного генератора для каждого чтения с использованием текущего времени, заданного как true или false. Если trueвыравнивания, сообщенные для двух одинаковых чтений, могут быть различными. Значение по умолчанию false, то есть, псевдослучайный генератор повторно инициализируется с использованием seed, полученного из считанной информации и начального числа.

Пример: 'Nondeterministic',true

Типы данных: logical

Количество позиций в начале или конце каждого чтения, где погрешности не разрешены, заданное как неотрицательное целое число.

Пример: 'NoGapPositions',5

Типы данных: double

Максимальное количество допустимых выравниваний для отчета перед завершением поиска, заданное в виде положительного целого числа 'Best', или 'All'. Если вы задаете положительное целое N, функция ищет до N различных, допустимых выравниваний для каждого чтения. 'Best' сообщает оптимальное выравнивание для каждого прочитанного. 'All' сообщает обо всех допустимых выравниваниях для каждого считанного значения, отсортированного по счетам выравнивания.

Счет выравнивания для выравнивания на парном конце равен сумме счетов выравнивания для отдельных пар.

Пример: 'NumAlignments','All'

Типы данных: double | char | string

Максимальное количество попыток повторного набора с повторяющимися началами, заданное в виде неотрицательного целого числа. Во время повторного заполнения функция выбирает новый набор чтений с различными смещениями, чтобы найти больше выравнивания.

Пример: 'NumReseedings',5

Типы данных: double

Максимальное количество последовательных попыток расширения seed перед получением нового seed, заданное как неотрицательное целое число. Расширение seed терпит неудачу, если оно не приводит к выравниванию по лучшему (или второму лучшему) счету.

Пример: 'NumSeedExtensions',10

Типы данных: double

Количество допустимых несоответствий в выравнивании seed во время многосветного выравнивания, заданное как 0 или 1.

Пример: 'NumSeedMismatches',1

Типы данных: double

Количество параллельных потоков для выполнения выравнивания, заданное в виде положительного целого числа. Потоки выполняются на отдельных процессорах или ядрах. Увеличение количества потоков обеспечивает значительное увеличение скорости (близкое к линейному), но также увеличивает площадь памяти.

Пример: 'NumThreads',4

Типы данных: double

Offrate, используемый при чтении индекса, чтобы уменьшить размер памяти, заданный как положительное целое число. Смещение должно быть больше, чем смещение, используемое для построения индекса.

Пример: 'Offrate',20

Типы данных: double

Положение в ссылочной последовательности, где начинается выравнивание для каждой последовательности, заданное как неотрицательное целое число.

Пример: 'PadPositions',10

Типы данных: double

Затраты на разрыв для открытия и расширения разрыва на считываемом элементе, заданные как двухэлементный вектор неотрицательных целых чисел. Первый элемент является стоимостью открытия зазора, а второй элемент - стоимостью расширения зазора. Учитывая вектор затрат [GO GE] , зазор считывания длины N назначается штраф в GO + N * GE.

Пример: 'ReadGapCosts',[4 2]

Типы данных: double

Считайте идентификатор группы для добавления на @RG заголовок линии в выход отчете SAM, заданный как вектор символов или строка. Если вы задаете любой идентификатор группы чтения, функция печатает @RG линия заголовка с тегом ID: далее указан указанный идентификатор группы.

Пример: 'ReadGroupID','ID1'

Типы данных: char | string

Чтение информации о группе для добавления в качестве поля на @RG заголовок линии в выход отчете SAM, заданный как вектор символов или строка. Это свойство применяется только в том случае, если вы задаете 'ReadGroupID'.

Пример: 'ReadGroup','Control'

Типы данных: char | string

Затраты на разрыв для открытия и расширения разрыва на опорном элементе, заданные как двухэлементный вектор неотрицательных целых чисел. Первый элемент является стоимостью открытия зазора, а второй элемент - стоимостью расширения зазора. Учитывая вектор затрат [GO GE] , ссылка зазор длины N назначается штраф GO + N * GE.

Пример: 'RefGapCosts',[4 2]

Типы данных: double

Флаг для переупорядочивания записей SAM для поддержания того же порядка, как в входных файлах, заданный как true или false. Это свойство применяется только, когда количество параллельных потоков больше единицы. Когда вы используете один поток, порядок записей в выходе тот же, что и порядок входов.

Пример: 'Reorder',true

Типы данных: logical

Число для установки seed в генераторе псевдослучайных чисел в виде неотрицательного целого числа.

Пример: 'Seed',3

Типы данных: double

Функция, регулирующая расстояние между подстроками seed во время выравнивания мультиseed, заданная как вектор символов или строка.

Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:

  • 'C'- Константа

  • 'L'- Линейный

  • 'S'- Квадратный корень

  • 'G'- Естественный журнал

Получившаяся функция H(x) = B + A * f(x), где x - длина чтения.

Для 'EndToEnd' режим выравнивания, функция по умолчанию 'S,1,1.15'. Для 'Local' mode, функция по умолчанию 'S,1,0.75'.

Пример: 'SeedIntervalFunction','S,2,2.15'

Типы данных: char | string

Seed подстроки для выравнивания во время многосветного выравнивания, заданная как положительное целое число.

Пример: 'SeedLength',25

Типы данных: double

Количество чтений, которые нужно игнорировать из начала входных файлов, заданное как неотрицательное целое число.

Пример: 'Skip',5

Типы данных: double

Количество остатков, которые нужно отсечь из 3 '-конца каждого считанного перед выравниванием, заданное как неотрицательное целое число.

Пример: 'Trim3',5

Типы данных: double

Количество остатков, которые нужно отсечь из 5 '-конца каждого считанного перед выравниванием, заданное как неотрицательное целое число.

Пример: 'Trim5',5

Типы данных: double

Количество чтений, учитываемых с начала входа файлов, заданное как положительное целое число. Значение по умолчанию Inf, то есть рассматриваются все чтения.

Пример: 'UpTo',1000

Типы данных: double

Функции объекта

getBowtie2CommandПереведите свойства объекта в опции Bowtie 2
getBowtie2TableИзвлечение таблицы со свойствами объекта и эквивалентными опциями Bowtie 2
presetУстановите комбинацию опций выравнивания
runСопоставить последовательность чтения в ссылочную последовательность используя Bowtie 2

Примеры

свернуть все

Создайте набор файлов индекса для генома дрозофилы. Сообщение об ошибке появляется, если при запуске функции не установлен пакет поддержки Bioinformatics Toolbox для Bowtie Aligner. Щелкните указанную ссылку, чтобы загрузить пакет из меню Add-on.

В данном примере ссылочная последовательность Dmel_chr4.fa уже поставляется с тулбоксом.

status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');

Если построение индекса успешно, функция возвращается 0 и создает файлы индексов (*.bt2) в текущей папке. Файлы имеют префикс 'Dmel_chr4_index'.

Иногда файлы индекса существуют, и вы хотите знать ссылочную последовательность, используемую для построения индекса. В этом случае используйте bowtie2inspect функция для получения дополнительной информации об ссылке.

bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');

По умолчанию файл выхода Dmel_chr4_retrieved.fa содержит последовательность ссылки. Можно также получить сводную информацию о имени ссылки и длинах вместо фактической последовательности. Для получения дополнительной информации о доступных опциях смотрите Bowtie2InspectOptions.

Когда индекс будет готов, сопоставьте последовательности чтения со ссылкой с помощью bowtie2 функция. Файлы чтения парного конца (SRR6008575_10k_1.fq и SRR6008575_10k_2.fq) уже поставляются с тулбоксом.

bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');

Выходы являются файлом в формате SAM, который содержит результаты отображения.

Можно задать различные опции выравнивания, передав синтаксическую строку Bowtie 2 или используя Bowtie2AlignOptions объект.

Предположим, что вы хотите отсечь некоторые остатки от 3' заканчивается перед выравниванием. Во-первых, создайте Bowtie2AlignOptions объект.

 alignOpt = Bowtie2AlignOptions;

Обрезка четырех остатков из 3' заканчивается перед выравниванием.

 alignOpt.Trim3 = 4;

Чтение карты на ссылку с помощью заданной опции выравнивания.

flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);

Ссылки

[1] Langmead, B., and S. Salzberg. «Быстрое выравнивание чтения с перерывами с Bowtie 2». Природные методы. 9, 2012, 357–359.

Введенный в R2018a
Для просмотра документации необходимо авторизоваться на сайте