bwaindex

Создайте индексы BWA из ссылочной последовательности

Описание

пример

bwaindex(referenceFile) создает индексные файлы BWA для ссылочной последовательности в referenceFile [1][2]. По умолчанию функция пишет индексные файлы в ту же директорию как referenceFile.

Индексные файлы находятся в AMB, ЭНН, BWT, PAC и форматах файлов SA.

bwaindex требует Пакета Поддержки BWA для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты Программной поддержки Bioinformatics Toolbox.

Примечание

bwaindex поддерживается на Mac и платформах UNIX® только.

пример

bwaindex(referenceFile,indexOptions) дополнительные опции использования заданы indexOptions.

пример

bwaindex(referenceFile,Name,Value) дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, bwaindex(referenceFile,'Algorithm','is') задает линейно-разовый алгоритм.

Примеры

свернуть все

Этот пример требует Пакета Поддержки BWA для Bioinformatics Toolbox™. Если пакет поддержки не установлен, программное обеспечение обеспечивает ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты Программной поддержки Bioinformatics Toolbox.

Создайте набор индексных файлов для генома Дрозофилы. Этот пример использует ссылочную последовательность Dmel_chr4.fa, предоставленный тулбокс. 'Prefix' аргумент позволяет вам задать префикс выходных индексных файлов. Можно также включать информацию о пути к файлу. В данном примере задайте префикс как Dmel_chr4 и сохраните индексные файлы в текущем каталоге.

bwaindex('Dmel_chr4.fa','Prefix','./Dmel_chr4');

Как альтернатива определению аргументов пары "имя-значение", можно использовать BWAIndexOptions объект задать опции индексации.

indexOpt = BWAIndexOptions;
indexOpt.Prefix = './Dmel_chr4';
indexOpt.Algorithm = 'bwtsw';
bwaindex('Dmel_chr4.fa',indexOpt);

Если индексные файлы готовы, сопоставляют последовательности чтения со ссылкой с помощью bwamem. Два парных конца читали, входным файлам уже предоставляют тулбокс. Используя аргументы пары "имя-значение", можно задать различные опции выравнивания, такие как количество параллельных потоков, чтобы использовать.

bwamem('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam','NumThreads',4);

В качестве альтернативы можно использовать BWAMEMoptions задавать опции выравнивания.

alignOpt = BWAMEMOptions;
alignOpt.NumThreads = 4;
bwamem('Dmel_chr4','SRR6008575_10k_1.fq','SRR6008575_10k_2.fq','SRR6008575_10k_chr4.sam',alignOpt)

Входные параметры

свернуть все

Имя ссылочного файла в виде вектора символов или строки. Файл должен быть FASTA-отформатированным файлом со ссылочной информацией о последовательности для индексации.

Типы данных: char | string

Дополнительные опции для индексации в виде BWAIndexOptions объект, вектор символов или строка. Вектор символов или строка должны быть в bwa index нативный синтаксис (снабженный префиксом тире). Если вы задаете BWAIndexOptions объект, функция использует только те свойства, которые установлены или изменены.

Типы данных: char | string

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: bwaindex(referenceFile,'Algorithm','bwtsw') задает, чтобы использовать алгоритм BWT-SW.

Алгоритм, чтобы создать BWT (Норы-Wheeler преобразовывают), индекс в виде вектора символов или строки. Опции:

  • 'is' — Линейно-разовый алгоритм. Требования к памяти для использования этой опции являются 5.37 раз размером базы данных. Вы не можете использовать эту опцию, если ваша база данных больше, чем 2 Гбайт.

  • 'bwtsw' — Алгоритм BWT-SW.

Алгоритм по умолчанию выбран автоматически на основе размера ссылочного генома.

Типы данных: char | string

Количество базисов обрабатывается на пакет в bwtsw алгоритм в виде положительной скалярной величины.

Типы данных: double

Дополнительные команды в виде вектора символов или строки.

Команды должны быть в нативном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB®.

Пример: 'ExtraCommand','-6'

Типы данных: char | string

Отметьте, чтобы включать все доступные параметры с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций в виде true или false.

Исходный (нативный) синтаксис снабжается префиксом одним или двумя тире. По умолчанию функция преобразует только заданные опции. Если значением является true, программное обеспечение преобразует все доступные параметры, со значениями по умолчанию для незаданных опций, к исходному синтаксису.

Примечание

Если вы устанавливаете IncludeAll к true, программное обеспечение переводит все доступные свойства со значениями по умолчанию для незаданных свойств. Единственное исключение - это, когда значением по умолчанию свойства является NaNInf, [], '', или "", затем программное обеспечение не переводит соответствующее свойство.

Пример: 'IncludeAll',true

Типы данных: логический

Префикс для выходных индексных файлов в виде вектора символов или строки. Можно задать только префикс или путь к файлу и префикс. Значение по умолчанию совпадает с именем файла входа FASTA.

Пример: 'Prefix','D:/ngs/GRCh38_p12'

Типы данных: char | string

Ссылки

[1] Литий, Хэн и Ричард Дербин. “Быстрое и Точное Короткое Выравнивание Чтения с Преобразованием Нор-Wheeler”. Биоинформатика 25, № 14 (15 июля 2009): 1754–60. https://doi.org/10.1093/bioinformatics/btp324.

[2] Литий, Хэн и Ричард Дербин. “Быстрое и Точное Долго считанное Выравнивание с Преобразованием Нор-Wheeler”. Биоинформатика 26, № 5 (1 марта 2010): 589–95. https://doi.org/10.1093/bioinformatics/btp698.

Введенный в R2020b