Параметры отображения операций чтения в ссылочную последовательность
A Bowtie2AlignOptions содержит параметры для запуска bowtie2 функция, которая выравнивает чтения по ссылочной последовательности.
создает alignOptions = Bowtie2AlignOptionsBowtie2AlignOptions со значениями свойств по умолчанию.
Bowtie2AlignOptions требуется интерфейс Toolbox™ биоинформатики для Bowtie Aligner. Если этот пакет поддержки не установлен, функция предоставляет ссылку для загрузки. Дополнительные сведения см. в разделе Пакеты поддержки ПО для панели инструментов биоинформатики.
Примечание
Bowtie2AlignOptions поддерживается только на платформах Mac и UNIX ®.
задает свойства, используя один или несколько аргументов пары имя-значение. Заключите каждое имя свойства в кавычки. Например, alignOptions = Bowtie2AlignOptions(Name,Value)alignOptions = Bowtie2AlignOptions('Trim5',10) определяет обрезку 10 остатков от конца 5 '.
S - Параметры выставкиПараметры выравнивания, заданные как символьный вектор. S должен быть в синтаксисе параметра Bowtie 2 (с префиксом одного или двух тире) [1].
AllowDovetail - Флаг, разрешающий конфигурацию «ласточкиного хвоста»false (по умолчанию) | trueФлаг, разрешающий конфигурирование «ласточкиного хвоста», указанный как true или false. Это свойство определяет, может ли выравнивание одного совмещения проходить за начало выравнивания другого совмещения и считаться ли оно согласованным.
Это свойство применяется только для парных операций чтения.
Пример: 'AllowDovetail',true
Типы данных: logical
AmbiguousPenalty - Штраф за должности с неоднозначными символами1 (по умолчанию) | неотрицательное целое числоШтраф для позиций с неоднозначными символами в последовательности чтения, ссылочной последовательности или обеих позиций, указанных как неотрицательное целое число.
Пример:
'AmbiguousPenalty',2
Типы данных: double
Encoding - Формат кодирования базового качества'Phred33' (по умолчанию) | 'Phred64' | 'Solexa' Формат кодирования базового качества во входных файлах, указанный как один из следующих: 'Phred33', 'Phred64', или 'Solexa'.
Пример: 'Encoding','Phred64'
Типы данных: char | string
ExcludeContain - Флаг, позволяющий одному совмещению содержать другое совмещениеfalse (по умолчанию) | trueФлаг, позволяющий одному совмещению содержать выравнивание другого сопряженного соединения и считаться согласованным, указанный как true или false.
Это свойство применяется только для парных операций чтения.
Пример: 'ExcludeContain',true
Типы данных: logical
ExcludeDiscordant - Флаг для включения несоответствующих трассfalse (по умолчанию) | trueФлаг для включения несоответствующих трасс, указанный как true или false. Несогласованное выравнивание - это выравнивание, в котором оба совмещения выравниваются однозначно, но не таким образом, чтобы они удовлетворяли ограничениям парного конца.
Пример: 'ExcludeDiscordant',true
Типы данных: logical
ExcludeMixed - Флаг для исключения смешанных трассfalse (по умолчанию) | trueФлаг для исключения смешанных трасс, указанный как true или false. Смешанное выравнивание состоит из совпадающих считываний, которые не согласуются или расходятся, но выравниваются по отдельности.
Это свойство применяется только для парных операций чтения.
Пример: 'ExcludeMixed',true
Типы данных: logical
ExcludeOverlap - Флаг для перекрытия совмещенияfalse (по умолчанию) | trueФлаг, позволяющий совмещению одной пары перекрываться с совмещением другой пары и считаться согласованным, указанный как true или false.
Пример: 'ExcludeOverlap',true
Типы данных: logical
ExcludeUnaligned - Флаг для исключения операций чтения, которые не удалось выровнятьfalse (по умолчанию) | trueФлаг для исключения операций чтения, которые не удалось выровнять, указан как true или false.
Пример: 'ExcludeUnaligned',true
Типы данных: logical
ExtraBowtie2Command - Дополнительные параметры, не включенные в свойства объекта'' (по умолчанию) | символьный векторДополнительные параметры, не включенные в свойства объекта, заданные как символьный вектор. Вектор символа должен быть в синтаксисе опции Bowtie 2 (с префиксом одного или двух тире). Значение по умолчанию - пустой символьный вектор ''.
Пример: 'ExtraBowtie2Command','--version'
Типы данных: char | string
IgnoreQuality - Флаг для игнорирования качества позиции чтенияfalse (по умолчанию) | trueФлаг для игнорирования фактического качества позиции считывания при несоответствии, указанный как true или false. Установка для этого свойства значения true позволяет максимально увеличить значение качества в этой несовпадающей позиции независимо от фактического значения.
Пример: 'IgnoreQuality',true
Типы данных: logical
MatchBonus - Вознаграждение добавлено к баллу выравнивания2 (по умолчанию) | неотрицательное целое числоВознаграждение, добавляемое к баллу выравнивания, когда позиция в считывании соответствует позиции в ссылке, указанной как неотрицательное целое число.
Пример: 'MatchBonus',5
Типы данных: double
MaxAmbiguousFunction - Функция, определяющая максимальное количество неоднозначных символов'L,0,0.15' (по умолчанию) | символьный вектор | строкаФункция, определяющая максимальное число неоднозначных символов, разрешенных при чтении, указанное как символьный вектор или строка.
Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:
'C'- Константа
'L'- Линейный
'S'- Квадратный корень
'G'- Естественный журнал
Результирующая функция: H(x) = B + A * f(x), где x - длина считывания.
Функция по умолчанию: 'L,0,0.15', то есть H(x) = 0 + 0.15 * x.
Пример: 'MaxAmbiguousFunction','L,-0.4,-0.6'
Типы данных: char | string
MemoryMappedIndex - Флаг для использования сопоставления памяти при загрузке индексаfalse (по умолчанию) | trueФлаг для использования сопоставления памяти (вместо файлового ввода-вывода) при загрузке индекса, указанный как true или false. Отображение памяти позволяет многим параллельным процессам совместно использовать изображение индекса в памяти, что приводит к более эффективной параллелизации задачи.
Пример: 'MemoryMappedIndex',true
Типы данных: logical
MinScoreFunction - Функция, определяющая порог минимального балла выравниванияФункция, определяющая минимальный порог оценки выравнивания, определяемый как символьный вектор или строка.
Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:
'C'- Константа
'L'- Линейный
'S'- Квадратный корень
'G'- Естественный журнал
Результирующая функция: H(x) = B + A * f(x), где x - длина считывания.
Для 'EndToEnd' режим выставки, функция по умолчанию 'L,-0.6,-0.6'. Для 'Local' режим, функция по умолчанию 'G,20,8'.
Пример: 'MinScoreFunction','L,-0.4,-0.6'
Типы данных: char | string
MismatchPenalty - Максимальное и минимальное значения для расчета штрафа за несоответствие[6 2] (по умолчанию) | двухэлементный векторМаксимальное и минимальное значения для вычисления штрафа за несоответствие во время выравнивания, заданного как двухэлементный вектор. Первый элемент является максимальным значением, а второй элемент - минимальным значением.
Число, меньшее или равное максимальному значению, и большее или равное минимальному значению вычитается из оценки выравнивания для каждой позиции, где считываемый символ выравнивается по ссылочному символу, символы не совпадают, и ни один из них не является N персонаж.
Пример: 'MismatchPenalty',[5 3]
Типы данных: double
Mode - Режим выставки'EndToEnd' (по умолчанию) | 'Local'Режим выставки, указанный как 'EndToEnd' или 'Local'.
В 'Local' режим, только часть считывания должна быть выровнена по ссылке, и некоторые остатки могут быть опущены (мягко подрезаны) для достижения наилучшего показателя выравнивания. В 'EndToEnd' режим, все чтение должно быть выровнено без мягкой отсечки.
Пример: 'Mode','Local'
Типы данных: char | string
Nondeterministic - Флаг для повторной инициализации псевдослучайного генератораfalse (по умолчанию) | trueФлаг для повторной инициализации псевдослучайного генератора для каждого чтения с использованием текущего времени, указанного как true или false. Если true, выравнивания, сообщаемые для двух идентичных считываний, могут быть различными. Значение по умолчанию: falseто есть псевдослучайный генератор повторно инициализируется с использованием начального числа, полученного из считанной информации, и начального числа.
Пример: 'Nondeterministic',true
Типы данных: logical
NoGapPositions - Количество позиций, в которых разрывы не допускаются4 (по умолчанию) | неотрицательное целое числоЧисло позиций в начале или конце каждого чтения, в которых пробелы недопустимы, указанное как неотрицательное целое число.
Пример: 'NoGapPositions',5
Типы данных: double
NumAlignments - Максимальное количество допустимых трасс для отчета'Best' (по умолчанию) | 'All' | положительное целое числоМаксимальное количество допустимых выравниваний для отчета перед завершением поиска, указанное как положительное целое число, 'Best', или 'All'. Если задано положительное целое число N, функция выполняет поиск до N отдельных допустимых трасс для каждого чтения. 'Best' сообщает наилучшее выравнивание для каждого чтения. 'All' сообщает о всех допустимых выравниваниях для каждого чтения, отсортированных по баллам выравнивания.
Оценка выравнивания для парного выравнивания на конце равна сумме оценок выравнивания отдельных пар.
Пример: 'NumAlignments','All'
Типы данных: double | char | string
NumReseedings - Максимальное число попыток повторной загрузки2 (по умолчанию) | неотрицательное целое числоМаксимальное число попыток повторной обработки с повторяющимися начальными числами, заданными как неотрицательное целое число. Во время повторной загрузки функция выбирает новый набор считываний с различными смещениями для поиска дополнительных трасс.
Пример: 'NumReseedings',5
Типы данных: double
NumSeedExtensions - Максимальное число последовательных попыток расширения начального уровня15 (по умолчанию) | неотрицательное целое числоМаксимальное число последовательных попыток расширения начального числа перед получением нового начального числа, указанного как неотрицательное целое число. Начальное расширение не удается, если оно не приводит к выравниванию с лучшим (или вторым) баллом.
Пример: 'NumSeedExtensions',10
Типы данных: double
NumSeedMismatches - Количество допустимых несоответствий в выравнивании семян0 (по умолчанию) | 1Количество допустимых несоответствий в начальной трассе во время многосетевой трассы, указанное как 0 или 1.
Пример: 'NumSeedMismatches',1
Типы данных: double
NumThreads - Количество параллельных нитей для выполнения выравнивания1 (по умолчанию) | положительное целое числоЧисло параллельных потоков для выполнения выравнивания, указанное как положительное целое число. Потоки выполняются на отдельных процессорах или ядрах. Увеличение числа потоков обеспечивает значительное увеличение скорости (близкое к линейному), но также увеличивает объем памяти.
Пример: 'NumThreads',4
Типы данных: double
Offrate - Offrate для использования при чтении индексаNaN (по умолчанию) | положительное целое числоСмещение, используемое при чтении индекса для уменьшения объема памяти, заданного как положительное целое число. Значение offrate должно быть больше значения offrate, используемого для построения индекса.
Пример: 'Offrate',20
Типы данных: double
PadPositions - Положение в ссылочной последовательности, где начинается выравнивание15 (по умолчанию) | неотрицательное целое числоПоложение в ссылочной последовательности, где начинается выравнивание для каждой последовательности, определяемое как неотрицательное целое число.
Пример: 'PadPositions',10
Типы данных: double
ReadGapCosts - Затраты на вскрытие и расширение разрыва[5 3] (по умолчанию) | двухэлементный вектор неотрицательных целых чиселЗатраты на разрыв при открытии и расширении промежутка на считывании, определяемые как двухэлементный вектор неотрицательных целых чисел. Первый элемент представляет собой стоимость открытия зазора, а второй элемент представляет собой стоимость продления зазора. Учитывая вектор затрат [GO
GE], промежутку считывания длиной N назначается штраф в размере GO + N * GE.
Пример: 'ReadGapCosts',[4 2]
Типы данных: double
ReadGroupID - Чтение идентификатора группы для добавления @RG строка заголовка'' (по умолчанию) | символьный вектор | строкаПрочитайте идентификатор группы для добавления в @RG строка заголовка в выходном отчете SAM, заданная как символьный вектор или строка. Если указан какой-либо идентификатор группы чтения, функция распечатывает @RG строка заголовка с тегом ID: за которым следует указанный идентификатор группы.
Пример: 'ReadGroupID','ID1'
Типы данных: char | string
ReadGroup - Чтение информации о группе для добавления в качестве поля @RG строка заголовка'' (по умолчанию) | символьный вектор | строкаПрочтите информацию о группе, которую необходимо добавить в поле @RG строка заголовка в выходном отчете SAM, заданная как символьный вектор или строка. Это свойство применяется только при указании 'ReadGroupID'.
Пример: 'ReadGroup','Control'
Типы данных: char | string
RefGapCosts - Затраты на вскрытие и расширение разрыва[5 3] (по умолчанию) | двухэлементный вектор неотрицательных целых чиселЗатраты на разрыв для открытия и расширения промежутка на привязке, определяемые как двухэлементный вектор неотрицательных целых чисел. Первый элемент представляет собой стоимость открытия зазора, а второй элемент представляет собой стоимость продления зазора. Учитывая вектор затрат [GO
GE], контрольному промежутку длиной N назначается штраф в размере GO + N * GE.
Пример: 'RefGapCosts',[4 2]
Типы данных: double
Reorder - Флаг для изменения порядка записей SAMfalse (по умолчанию) | trueФлажок для изменения порядка записей SAM для сохранения того же порядка, что и во входных файлах, указанный как true или false. Это свойство применяется только в том случае, если число параллельных потоков больше единицы. При использовании одного потока порядок записей в выходных данных совпадает с порядком входных данных.
Пример: 'Reorder',true
Типы данных: logical
Seed - Число для установки начального числа в генераторе псевдослучайных чисел0 (по умолчанию) | неотрицательное целое числоЧисло для задания начального числа в генераторе псевдослучайных чисел, указанное как неотрицательное целое число.
Пример: 'Seed',3
Типы данных: double
SeedIntervalFunction - Функция, регулирующая расстояние между подстроками начального уровняФункция, управляющая расстоянием между начальными подстроками во время многосетевого выравнивания, заданная как символьный вектор или строка.
Функция имеет формат 'f,B,A', где f - тип функции, B - постоянный член, а A - коэффициент. Доступные типы функций:
'C'- Константа
'L'- Линейный
'S'- Квадратный корень
'G'- Естественный журнал
Результирующая функция: H(x) = B + A * f(x), где x - длина считывания.
Для 'EndToEnd' режим выставки, функция по умолчанию 'S,1,1.15'. Для 'Local' режим, функция по умолчанию 'S,1,0.75'.
Пример: 'SeedIntervalFunction','S,2,2.15'
Типы данных: char | string
SeedLength - Длина начальной подстроки для выравнивания во время многосетевого выравнивания20 (по умолчанию) | положительное целое числоНачальная длина подстроки для выравнивания во время многосетевого выравнивания, заданная как положительное целое число.
Пример: 'SeedLength',25
Типы данных: double
Skip - Количество игнорируемых операций чтения0 (по умолчанию) | неотрицательное целое числоЧисло операций чтения, игнорируемых с начала входных файлов, указанное как неотрицательное целое число.
Пример: 'Skip',5
Типы данных: double
Trim3 - Количество остатков для обрезки от 3 '-конца0 (по умолчанию) | неотрицательное целое числоКоличество остатков для отсечения от 3 '-конца каждого чтения перед выравниванием, указанное как неотрицательное целое число.
Пример: 'Trim3',5
Типы данных: double
Trim5 - Количество остатков для обрезки от 5 '-конца0 (по умолчанию) | неотрицательное целое числоКоличество остатков для отсечения от 5 '-конца каждого чтения перед выравниванием, указанное как неотрицательное целое число.
Пример: 'Trim5',5
Типы данных: double
UpTo - Количество считываний с начала входных файловInf (по умолчанию) | положительное целое числоЧисло считываний с начала входных файлов, указанное как положительное целое число. Значение по умолчанию: Inf, то есть рассматриваются все чтения.
Пример: 'UpTo',1000
Типы данных: double
getBowtie2Command | Перевести свойства объекта в параметры Bowtie 2 |
getBowtie2Table | Извлечение таблицы со свойствами объекта и эквивалентными параметрами Bowtie 2 |
preset | Задать комбинацию опций трассы |
run | Считывание последовательности карт в ссылочную последовательность с помощью Bowtie 2 |
Создайте набор индексных файлов для генома дрозофилы. Если при запуске функции не установлен интерфейс панели инструментов биоинформатики для пакета поддержки Bowtie Aligner, появится сообщение об ошибке. Щелкните предоставленную ссылку, чтобы загрузить пакет из меню Add-on.
В этом примере ссылочная последовательность Dmel_chr4.fa уже поставляется с панелью инструментов.
status = bowtie2build('Dmel_chr4.fa', 'Dmel_chr4_index');
Если построение индекса выполнено успешно, функция возвращает 0 и создает индексные файлы (*.bt2) в текущей папке. Файлы имеют префикс 'Dmel_chr4_index'.
Иногда файлы индекса существуют, и требуется знать последовательность ссылок, используемую для построения индекса. В этом случае используйте bowtie2inspect для получения дополнительной информации о ссылке.
bowtie2inspect('Dmel_chr4', 'Dmel_chr4_retrieved.fa');
По умолчанию выходной файл Dmel_chr4_retrieved.fa содержит последовательность ссылки. Вместо фактической последовательности можно также получить сводную информацию о ссылочном имени и длине. Дополнительные сведения о доступных параметрах см. в разделе Bowtie2InspectOptions.
Как только индекс готов, сопоставьте считанные последовательности со ссылкой с помощью bowtie2 функция. Файлы для чтения на парной стороне (SRR6008575_10k_1.fq и SRR6008575_10k_2.fq) уже обеспечены панелью инструментов.
bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam');
Выходные данные представляют собой файл в формате SAM, содержащий результаты сопоставления.
Можно задать различные параметры выравнивания, передав синтаксическую строку Bowtie 2 или используя Bowtie2AlignOptions объект.
Предположим, что вы хотите обрезать некоторые остатки из 3' завершить перед выравниванием. Сначала создайте Bowtie2AlignOptions объект.
alignOpt = Bowtie2AlignOptions;
Обрезать четыре остатка из 3' завершить перед выравниванием.
alignOpt.Trim3 = 4;
Выполняется считывание ссылки с помощью указанной опции выравнивания.
flag = bowtie2('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4_trimmed.sam',alignOpt);
[1] Лэнгмед, Б. и С. Зальцберг. «Быстрое согласование чтения с Bowtie 2». Методы природы. 9, 2012, 357–359.
bowtie2 | Bowtie2AlignOptions | bowtie2build | Bowtie2BuildOptions | bowtie2inspect | Bowtie2InspectOptions
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.