bwaindex

Создайте индексы BWA из ссылочной последовательности

Описание

пример

bwaindex(referenceFile) создает файлы индексов BWA для ссылочной последовательности в referenceFile [1][2]. По умолчанию функция записывает файлы индекса в ту же директорию, что и referenceFile.

Индексные файлы находятся в форматах AMB, ANN, BWT, PAC и SA.

bwaindex требуется пакет поддержки BWA для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция предоставляет ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.

Примечание

bwaindex поддерживается в Mac и UNIX® только платформы.

пример

bwaindex(referenceFile,indexOptions) использует дополнительные опции, заданные indexOptions.

пример

bwaindex(referenceFile,Name,Value) использует дополнительные опции, заданные одним или несколькими аргументами пары "имя-значение". Для примера, bwaindex(referenceFile,'Algorithm','is') задает алгоритм линейного времени.

Примеры

свернуть все

Этот пример требует пакета поддержки BWA для Bioinformatics Toolbox™. Если пакет поддержки не установлен, программное обеспечение предоставляет ссылку для загрузки. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.

Создайте набор файлов индекса для генома дрозофилы. Этот пример использует ссылочную последовательность Dmel_chr4.fa, поставляется с тулбоксом. The 'Prefix' Аргумент позволяет вам задать префикс выходных файлов индекса. Можно также включать информацию о пути к файлу. В данном примере задайте префикс следующим Dmel_chr4 и сохраните файлы индекса в текущей директории.

bwaindex('Dmel_chr4.fa','Prefix','./Dmel_chr4');

В качестве альтернативы указанию аргументов пары "имя-значение" можно использовать BWAIndexOptions Объект, чтобы задать опции индексации.

indexOpt = BWAIndexOptions;
indexOpt.Prefix = './Dmel_chr4';
indexOpt.Algorithm = 'bwtsw';
bwaindex('Dmel_chr4.fa',indexOpt);

Когда файлы индекса будут готовы, сопоставьте последовательности чтения со ссылкой с помощью bwamem. Два входных файлов считывания в паре уже поставляются с тулбоксом. Используя аргументы пары "имя-значение", можно задать различные опции выравнивания, такие как количество параллельных потоков для использования.

bwamem('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam','NumThreads',4);

Также можно использовать BWAMEMoptions для задания опций выравнивания.

alignOpt = BWAMEMOptions;
alignOpt.NumThreads = 4;
bwamem('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam',alignOpt)

Входные параметры

свернуть все

Ссылка на имя файла, заданная как вектор символов или строка. Файл должен быть файлом в формате FASTA с информацией о ссылочной последовательности для индексации.

Типы данных: char | string

Дополнительные опции индексации, заданные как BWAIndexOptions объект, вектор символов или строка. Векторы символов или строка должны быть в bwa index собственный синтаксис (с префиксом штриха). Если вы задаете BWAIndexOptions объект, функция использует только те свойства, которые заданы или изменены.

Типы данных: char | string

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: bwaindex(referenceFile,'Algorithm','bwtsw') задает использование алгоритма BWT-SW.

Алгоритм для построения индекса BWT (преобразование Burrows-Wheeler), заданного в виде вектора символов или строки. Опции:

  • 'is' - Алгоритм линейного времени. Требования к памяти для использования этой опции в 5,37 раза превышают размер базы данных. Вы не можете использовать эту опцию, если объем базы данных превышает 2 ГБ.

  • 'bwtsw' - алгоритм BWT-SW.

Алгоритм по умолчанию выбирается автоматически на основе размера эталонного генома.

Типы данных: char | string

Количество основ, обрабатываемых за пакет в bwtsw алгоритм, заданный как положительная скалярная величина.

Типы данных: double

Дополнительные команды, заданные как вектор символов или строка.

Команды должны быть в собственном синтаксисе (с префиксом один или два штриха). Используйте эту опцию для применения недокументированных флагов и флагов без соответствующего MATLAB® свойства.

Пример: 'ExtraCommand','-6'

Типы данных: char | string

Флаг для включения всех доступных опций с соответствующими значениями по умолчанию при преобразовании в синтаксис исходных опций, заданный как true или false.

Исходный (нативный) синтаксис префиксируется одним или двумя штрихами. По умолчанию функция преобразует только указанные опции. Если значение trueпрограммное обеспечение преобразует все доступные опции со значениями по умолчанию для неопределенных опций в исходный синтаксис.

Примечание

Если вы задаете IncludeAll на trueпрограммное обеспечение преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что когда значение по умолчанию свойства NaN, Inf, [], '', или "", тогда программное обеспечение не преобразует соответствующее свойство.

Пример: 'IncludeAll',true

Типы данных: logical

Префикс для выходных файлов индекса, заданный как вектор символов или строка. Можно задать только префикс или путь к файлу и префикс. Значение по умолчанию совпадает с входом файла FASTA.

Пример: 'Prefix','D:/ngs/GRCh38_p12'

Типы данных: char | string

Ссылки

[1] Ли, Хэн и Ричард Дурбин. Быстрая и точная выравнивание при коротком считывании с преобразованием Burrows-Wheeler. Биоинформатика 25, № 14 (15 июля 2009): 1754-60. https://doi.org/10.1093/bioinformatics/btp324.

[2] Ли, Хэн и Ричард Дурбин. Быстрая и точная выравнивание при долгом чтении с преобразованием Burrows-Wheeler. Биоинформатика 26, № 5 (1 марта 2010): 589-95. https://doi.org/10.1093/bioinformatics/btp698.

Введенный в R2020b