exponenta event banner

bwaindex

Создание индексов BWA из ссылочной последовательности

Описание

пример

bwaindex(referenceFile) создает файлы индекса BWA для ссылочной последовательности в referenceFile [1][2]. По умолчанию функция записывает индексные файлы в тот же каталог, что и referenceFile.

Индексные файлы находятся в форматах AMB, ANN, BWT, PAC и SA.

bwaindex требуется пакет поддержки BWA для Toolbox™ биоинформатики. Если пакет поддержки не установлен, функция предоставляет ссылку для загрузки. Дополнительные сведения см. в разделе Пакеты поддержки ПО для панели инструментов биоинформатики.

Примечание

bwaindex поддерживается только на платформах Mac и UNIX ®.

пример

bwaindex(referenceFile,indexOptions) использует дополнительные параметры, указанные indexOptions.

пример

bwaindex(referenceFile,Name,Value) использует дополнительные параметры, заданные одним или несколькими аргументами пары имя-значение. Например, bwaindex(referenceFile,'Algorithm','is') определяет алгоритм линейного времени.

Примеры

свернуть все

В этом примере требуется пакет поддержки BWA для Toolbox™ биоинформатики. Если пакет поддержки не установлен, программа предоставляет ссылку для загрузки. Дополнительные сведения см. в разделе Пакеты поддержки ПО для панели инструментов биоинформатики.

Создайте набор индексных файлов для генома дрозофилы. В этом примере используется ссылочная последовательность Dmel_chr4.fa, с набором инструментов. 'Prefix' позволяет определить префикс выходных индексных файлов. Можно также включить информацию о пути к файлу. Для этого примера определите префикс как Dmel_chr4 и сохраните индексные файлы в текущей папке.

bwaindex('Dmel_chr4.fa','Prefix','./Dmel_chr4');

В качестве альтернативы указанию аргументов пары «имя-значение» можно использовать BWAIndexOptions для задания параметров индексирования.

indexOpt = BWAIndexOptions;
indexOpt.Prefix = './Dmel_chr4';
indexOpt.Algorithm = 'bwtsw';
bwaindex('Dmel_chr4.fa',indexOpt);

Как только индексные файлы будут готовы, сопоставьте считанные последовательности со ссылкой с помощью bwamem. На панели инструментов уже имеются два входных файла для чтения. С помощью аргументов пары «имя-значение» можно задать различные параметры выравнивания, например, количество параллельных потоков.

bwamem('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam','NumThreads',4);

Кроме того, можно использовать BWAMEMoptions для задания параметров трассы.

alignOpt = BWAMEMOptions;
alignOpt.NumThreads = 4;
bwamem('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam',alignOpt)

Входные аргументы

свернуть все

Имя файла ссылки, указанное как символьный вектор или строка. Файл должен иметь формат FASTA с информацией о ссылочной последовательности для индексирования.

Типы данных: char | string

Дополнительные параметры индексирования, указанные как BWAIndexOptions объект, символьный вектор или строка. Вектор или строка символа должны быть в bwa index собственный синтаксис (префикс с помощью тире). Если указать BWAIndexOptions функция использует только те свойства, которые заданы или изменены.

Типы данных: char | string

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: bwaindex(referenceFile,'Algorithm','bwtsw') определяет использование алгоритма BWT-SW.

Алгоритм построения индекса BWT (преобразование Бэрроуза-Уилера), заданного как символьный вектор или строка. Возможны следующие варианты:

  • 'is' - Алгоритм линейного времени. Объем памяти, необходимый для использования этого параметра, в 5,37 раза превышает размер базы данных. Этот параметр нельзя использовать, если размер базы данных превышает 2 ГБ.

  • 'bwtsw' - алгоритм BWT-SW.

Алгоритм по умолчанию выбирается автоматически на основе размера эталонного генома.

Типы данных: char | string

Количество баз, обработанных за партию в bwtsw алгоритм, заданный как положительный скаляр.

Типы данных: double

Дополнительные команды, определяемые как символьный вектор или строка.

Команды должны иметь собственный синтаксис (префикс одного или двух тире). Эта опция используется для применения флагов и флагов без документов без соответствующих свойств MATLAB ®.

Пример: 'ExtraCommand','-6'

Типы данных: char | string

Флажок для включения всех доступных опций с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, указанный как true или false.

Исходный (собственный) синтаксис префиксируется одним или двумя тире. По умолчанию функция преобразует только указанные опции. Если значение равно true, программа преобразует все доступные опции со значениями по умолчанию для неуказанных опций в исходный синтаксис.

Примечание

Если установить IncludeAll кому true, программа преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что если значением по умолчанию свойства является NaN, Inf, [], '', или "", то программное обеспечение не переводит соответствующее свойство.

Пример: 'IncludeAll',true

Типы данных: logical

Префикс для выходных файлов индекса, заданный как символьный вектор или строка. Можно указать только префикс или путь к файлу и префикс. Значение по умолчанию совпадает с именем входного файла FASTA.

Пример: 'Prefix','D:/ngs/GRCh38_p12'

Типы данных: char | string

Ссылки

[1] Ли, Хенг и Ричард Дурбин. «Быстрое и точное короткое выравнивание чтения с преобразованием Burrows-Wheeler». Биоинформатика 25, № 14 (15 июля 2009): 1754-60. https://doi.org/10.1093/bioinformatics/btp324.

[2] Ли, Хенг и Ричард Дурбин. «Быстрое и точное длинночитаемое выравнивание с преобразованием Бэрроуз-Уилер». Биоинформатика 26, № 5 (1 марта 2010): 589-95. https://doi.org/10.1093/bioinformatics/btp698.

Представлен в R2020b