exponenta event banner

Bowtie2AlignOptions

Параметры отображения операций чтения в ссылочную последовательность

Описание

A Bowtie2AlignOptions содержит параметры для запуска bowtie2 функция, которая выравнивает чтения по ссылочной последовательности.

Создание

Описание

пример

alignOptions = Bowtie2AlignOptions создает Bowtie2AlignOptions со значениями свойств по умолчанию.

Bowtie2AlignOptions требуется интерфейс Toolbox™ биоинформатики для Bowtie Aligner. Если этот пакет поддержки не установлен, функция предоставляет ссылку для загрузки. Дополнительные сведения см. в разделе Пакеты поддержки ПО для панели инструментов биоинформатики.

Примечание

Bowtie2AlignOptions поддерживается только на платформах Mac и UNIX ®.

пример

alignOptions = Bowtie2AlignOptions(Name,Value) задает свойства, используя один или несколько аргументов пары имя-значение. Заключите каждое имя свойства в кавычки. Например, alignOptions = Bowtie2AlignOptions('Trim5',10) определяет обрезку 10 остатков от конца 5 '.

пример

alignOptions = Bowtie2AlignOptions(S) указывает необязательные параметры в символьном векторе S.

Входные аргументы

развернуть все

Параметры выравнивания, заданные как символьный вектор. S должен быть в синтаксисе параметра Bowtie 2 (с префиксом одного или двух тире) [1].

Свойства

развернуть все

Флаг, разрешающий конфигурирование «ласточкиного хвоста», указанный как true или false. Это свойство определяет, может ли выравнивание одного совмещения проходить за начало выравнивания другого совмещения и считаться ли оно согласованным.

Это свойство применяется только для парных операций чтения.

Пример: 'AllowDovetail',true

Типы данных: logical

Штраф для позиций с неоднозначными символами в последовательности чтения, ссылочной последовательности или обеих позиций, указанных как неотрицательное целое число.

Пример: 'AmbiguousPenalty',2

Типы данных: double

Формат кодирования базового качества во входных файлах, указанный как один из следующих: 'Phred33', 'Phred64', или 'Solexa'.

Пример: 'Encoding','Phred64'

Типы данных: char | string

Флаг, позволяющий одному совмещению содержать выравнивание другого сопряженного соединения и считаться согласованным, указанный как true или false.

Это свойство применяется только для парных операций чтения.

Пример: 'ExcludeContain',true

Типы данных: logical

Флаг для включения несоответствующих трасс, указанный как true или false. Несогласованное выравнивание - это выравнивание, в котором оба совмещения выравниваются однозначно, но не таким образом, чтобы они удовлетворяли ограничениям парного конца.

Пример: 'ExcludeDiscordant',true

Типы данных: logical

Флаг для исключения смешанных трасс, указанный как true или false. Смешанное выравнивание состоит из совпадающих считываний, которые не согласуются или расходятся, но выравниваются по отдельности.

Это свойство применяется только для парных операций чтения.

Пример: 'ExcludeMixed',true

Типы данных: logical

Флаг, позволяющий совмещению одной пары перекрываться с совмещением другой пары и считаться согласованным, указанный как true или false.

Пример: 'ExcludeOverlap',true

Типы данных: logical

Флаг для исключения операций чтения, которые не удалось выровнять, указан как true или false.

Пример: 'ExcludeUnaligned',true

Типы данных: logical

Дополнительные параметры, не включенные в свойства объекта, заданные как символьный вектор. Вектор символа должен быть в синтаксисе опции Bowtie 2 (с префиксом одного или двух тире). Значение по умолчанию - пустой символьный вектор ''.

Пример: 'ExtraBowtie2Command','--version'

Типы данных: char | string

Флаг для игнорирования фактического качества позиции считывания при несоответствии, указанный как true или false. Установка для этого свойства значения true позволяет максимально увеличить значение качества в этой несовпадающей позиции независимо от фактического значения.

Пример: 'IgnoreQuality',true

Типы данных: logical

Вознаграждение, добавляемое к баллу выравнивания, когда позиция в считывании соответствует позиции в ссылке, указанной как неотрицательное целое число.

Пример: 'MatchBonus',5

Типы данных: double

Функция, определяющая максимальное число неоднозначных символов, разрешенных при чтении, указанное как символьный вектор или строка.

Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:

  • 'C'- Константа

  • 'L'- Линейный

  • 'S'- Квадратный корень

  • 'G'- Естественный журнал

Результирующая функция: H(x) = B + A * f(x), где x - длина считывания.

Функция по умолчанию: 'L,0,0.15', то есть H(x) = 0 + 0.15 * x.

Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'

Типы данных: char | string

Флаг для использования сопоставления памяти (вместо файлового ввода-вывода) при загрузке индекса, указанный как true или false. Отображение памяти позволяет многим параллельным процессам совместно использовать изображение индекса в памяти, что приводит к более эффективной параллелизации задачи.

Пример: 'MemoryMappedIndex',true

Типы данных: logical

Функция, определяющая минимальный порог оценки выравнивания, определяемый как символьный вектор или строка.

Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:

  • 'C'- Константа

  • 'L'- Линейный

  • 'S'- Квадратный корень

  • 'G'- Естественный журнал

Результирующая функция: H(x) = B + A * f(x), где x - длина считывания.

Для 'EndToEnd' режим выставки, функция по умолчанию 'L,-0.6,-0.6'. Для 'Local' режим, функция по умолчанию 'G,20,8'.

Пример: 'MinScoreFunction','L,-0.4,-0.6'

Типы данных: char | string

Максимальное и минимальное значения для вычисления штрафа за несоответствие во время выравнивания, заданного как двухэлементный вектор. Первый элемент является максимальным значением, а второй элемент - минимальным значением.

Число, меньшее или равное максимальному значению, и большее или равное минимальному значению вычитается из оценки выравнивания для каждой позиции, где считываемый символ выравнивается по ссылочному символу, символы не совпадают, и ни один из них не является N персонаж.

Пример: 'MismatchPenalty',[5 3]

Типы данных: double

Режим выставки, указанный как 'EndToEnd' или 'Local'.

В 'Local' режим, только часть считывания должна быть выровнена по ссылке, и некоторые остатки могут быть опущены (мягко подрезаны) для достижения наилучшего показателя выравнивания. В 'EndToEnd' режим, все чтение должно быть выровнено без мягкой отсечки.

Пример: 'Mode','Local'

Типы данных: char | string

Флаг для повторной инициализации псевдослучайного генератора для каждого чтения с использованием текущего времени, указанного как true или false. Если true, выравнивания, сообщаемые для двух идентичных считываний, могут быть различными. Значение по умолчанию: falseто есть псевдослучайный генератор повторно инициализируется с использованием начального числа, полученного из считанной информации, и начального числа.

Пример: 'Nondeterministic',true

Типы данных: logical

Число позиций в начале или конце каждого чтения, в которых пробелы недопустимы, указанное как неотрицательное целое число.

Пример: 'NoGapPositions',5

Типы данных: double

Максимальное количество допустимых выравниваний для отчета перед завершением поиска, указанное как положительное целое число, 'Best', или 'All'. Если задано положительное целое число N, функция выполняет поиск до N отдельных допустимых трасс для каждого чтения. 'Best' сообщает наилучшее выравнивание для каждого чтения. 'All' сообщает о всех допустимых выравниваниях для каждого чтения, отсортированных по баллам выравнивания.

Оценка выравнивания для парного выравнивания на конце равна сумме оценок выравнивания отдельных пар.

Пример: 'NumAlignments','All'

Типы данных: double | char | string

Максимальное число попыток повторной обработки с повторяющимися начальными числами, заданными как неотрицательное целое число. Во время повторной загрузки функция выбирает новый набор считываний с различными смещениями для поиска дополнительных трасс.

Пример: 'NumReseedings',5

Типы данных: double

Максимальное число последовательных попыток расширения начального числа перед получением нового начального числа, указанного как неотрицательное целое число. Начальное расширение не удается, если оно не приводит к выравниванию с лучшим (или вторым) баллом.

Пример: 'NumSeedExtensions',10

Типы данных: double

Количество допустимых несоответствий в начальной трассе во время многосетевой трассы, указанное как 0 или 1.

Пример: 'NumSeedMismatches',1

Типы данных: double

Число параллельных потоков для выполнения выравнивания, указанное как положительное целое число. Потоки выполняются на отдельных процессорах или ядрах. Увеличение числа потоков обеспечивает значительное увеличение скорости (близкое к линейному), но также увеличивает объем памяти.

Пример: 'NumThreads',4

Типы данных: double

Смещение, используемое при чтении индекса для уменьшения объема памяти, заданного как положительное целое число. Значение offrate должно быть больше значения offrate, используемого для построения индекса.

Пример: 'Offrate',20

Типы данных: double

Положение в ссылочной последовательности, где начинается выравнивание для каждой последовательности, определяемое как неотрицательное целое число.

Пример: 'PadPositions',10

Типы данных: double

Затраты на разрыв при открытии и расширении промежутка на считывании, определяемые как двухэлементный вектор неотрицательных целых чисел. Первый элемент представляет собой стоимость открытия зазора, а второй элемент представляет собой стоимость продления зазора. Учитывая вектор затрат [GO GE], промежутку считывания длиной N назначается штраф в размере GO + N * GE.

Пример: 'ReadGapCosts',[4 2]

Типы данных: double

Прочитайте идентификатор группы для добавления в @RG строка заголовка в выходном отчете SAM, заданная как символьный вектор или строка. Если указан какой-либо идентификатор группы чтения, функция распечатывает @RG строка заголовка с тегом ID: за которым следует указанный идентификатор группы.

Пример: 'ReadGroupID','ID1'

Типы данных: char | string

Прочтите информацию о группе, которую необходимо добавить в поле @RG строка заголовка в выходном отчете SAM, заданная как символьный вектор или строка. Это свойство применяется только при указании 'ReadGroupID'.

Пример: 'ReadGroup','Control'

Типы данных: char | string

Затраты на разрыв для открытия и расширения промежутка на привязке, определяемые как двухэлементный вектор неотрицательных целых чисел. Первый элемент представляет собой стоимость открытия зазора, а второй элемент представляет собой стоимость продления зазора. Учитывая вектор затрат [GO GE], контрольному промежутку длиной N назначается штраф в размере GO + N * GE.

Пример: 'RefGapCosts',[4 2]

Типы данных: double

Флажок для изменения порядка записей SAM для сохранения того же порядка, что и во входных файлах, указанный как true или false. Это свойство применяется только в том случае, если число параллельных потоков больше единицы. При использовании одного потока порядок записей в выходных данных совпадает с порядком входных данных.

Пример: 'Reorder',true

Типы данных: logical

Число для задания начального числа в генераторе псевдослучайных чисел, указанное как неотрицательное целое число.

Пример: 'Seed',3

Типы данных: double

Функция, управляющая расстоянием между начальными подстроками во время многосетевого выравнивания, заданная как символьный вектор или строка.

Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:

  • 'C'- Константа

  • 'L'- Линейный

  • 'S'- Квадратный корень

  • 'G'- Естественный журнал

Результирующая функция: H(x) = B + A * f(x), где x - длина считывания.

Для 'EndToEnd' режим выставки, функция по умолчанию 'S,1,1.15'. Для 'Local' режим, функция по умолчанию 'S,1,0.75'.

Пример: 'SeedIntervalFunction','S,2,2.15'

Типы данных: char | string

Начальная длина подстроки для выравнивания во время многосетевого выравнивания, заданная как положительное целое число.

Пример: 'SeedLength',25

Типы данных: double

Число операций чтения, игнорируемых с начала входных файлов, указанное как неотрицательное целое число.

Пример: 'Skip',5

Типы данных: double

Количество остатков для отсечения от 3 '-конца каждого чтения перед выравниванием, указанное как неотрицательное целое число.

Пример: 'Trim3',5

Типы данных: double

Количество остатков для отсечения от 5 '-конца каждого чтения перед выравниванием, указанное как неотрицательное целое число.

Пример: 'Trim5',5

Типы данных: double

Число считываний с начала входных файлов, указанное как положительное целое число. Значение по умолчанию: Inf, то есть рассматриваются все чтения.

Пример: 'UpTo',1000

Типы данных: double

Функции объекта

getBowtie2CommandПеревести свойства объекта в параметры Bowtie 2
getBowtie2TableИзвлечение таблицы со свойствами объекта и эквивалентными параметрами Bowtie 2
presetЗадать комбинацию опций трассы
runСчитывание последовательности карт в ссылочную последовательность с помощью Bowtie 2

Примеры

свернуть все

Создайте набор индексных файлов для генома дрозофилы. Если при запуске функции не установлен интерфейс панели инструментов биоинформатики для пакета поддержки Bowtie Aligner, появится сообщение об ошибке. Щелкните предоставленную ссылку, чтобы загрузить пакет из меню Add-on.

В этом примере ссылочная последовательность Dmel_chr4.fa уже поставляется с панелью инструментов.

status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');

Если построение индекса выполнено успешно, функция возвращает 0 и создает индексные файлы (*.bt2) в текущей папке. Файлы имеют префикс 'Dmel_chr4_index'.

Иногда файлы индекса существуют, и требуется знать последовательность ссылок, используемую для построения индекса. В этом случае используйте bowtie2inspect для получения дополнительной информации о ссылке.

bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');

По умолчанию выходной файл Dmel_chr4_retrieved.fa содержит последовательность ссылки. Вместо фактической последовательности можно также получить сводную информацию о ссылочном имени и длине. Дополнительные сведения о доступных параметрах см. в разделе Bowtie2InspectOptions.

Как только индекс готов, сопоставьте считанные последовательности со ссылкой с помощью bowtie2 функция. Файлы для чтения на парной стороне (SRR6008575_10k_1.fq и SRR6008575_10k_2.fq) уже обеспечены панелью инструментов.

bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');

Выходные данные представляют собой файл в формате SAM, содержащий результаты сопоставления.

Можно задать различные параметры выравнивания, передав синтаксическую строку Bowtie 2 или используя Bowtie2AlignOptions объект.

Предположим, что вы хотите обрезать некоторые остатки из 3' завершить перед выравниванием. Сначала создайте Bowtie2AlignOptions объект.

 alignOpt = Bowtie2AlignOptions;

Обрезать четыре остатка из 3' завершить перед выравниванием.

 alignOpt.Trim3 = 4;

Выполняется считывание ссылки с помощью указанной опции выравнивания.

flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);

Ссылки

[1] Лэнгмед, Б. и С. Зальцберг. «Быстрое согласование чтения с Bowtie 2». Методы природы. 9, 2012, 357–359.

Представлен в R2018a