blastformat

Создайте локальную базу данных BLAST

Синтаксис

blastformat('Inputdb', InputdbValue)
blastformat(..., 'FormatPath', FormatPathValue, ...)
blastformat(..., 'Title', TitleValue, ...)
blastformat(..., 'Log', LogValue, ...)
blastformat(..., 'Protein', ProteinValue, ...)
blastformat(..., 'FormatArgs', FormatArgsValue, ...)

Аргументы

InputdbValueВектор символов или строка, задающая имя файла или путь и имя файла файла FASTA, содержащего набор последовательностей, которые будут отформатированы как blastable база данных. Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в текущей папке. (Это соответствует опции formatdb -i.)
FormatPathValueВектор символов или строка, задающая полный путь к исполняемому файлу formatdb, включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь.
TitleValueВектор символов или строка, задающая заголовок для локальной базы данных. Значением по умолчанию является имя файла входа FASTA. (Это соответствует опции formatdb -t.)
LogValueВектор символов или строка, задающая имя файла или путь и имя файла для файла журнала, сопоставлены с локальной базой данных. Значением по умолчанию является formatdb.log. (Это соответствует опции formatdb -l.)
ProteinValueЗадает, являются ли последовательности, отформатированные как локальная база данных BLAST, белком или нет. Выбором является true (значение по умолчанию) или false. (Это соответствует опции formatdb -p.)
FormatArgsValueNCBI команда formatdb, то есть, вектор символов или строка, содержащая один или несколько экземпляров -x и опции, сопоставленной с ним, используемой, чтобы задать входные параметры.

Описание

Примечание

Чтобы использовать функцию blastformat, у вас должна быть локальная копия исполняемого файла formatdb NCBI, доступного от вашей системы. Можно загрузить исполняемый файл formatdb путем доступа к исполняемым файлам BLAST. Запустите загруженный исполняемый файл и сконфигурируйте его для вашей системы. Для удобства рассмотрите размещение исполняемого файла formatdb NCBI на вашем системном пути.

blastformat('Inputdb', InputdbValue) вызывает локальную версию исполняемого файла formatdb NCBI с InputdbValue, именем файла или путем и именем файла файла FASTA, содержащего набор последовательностей. Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB или в текущей папке. (Это соответствует опции formatdb -i.)

Это затем форматирует последовательности как локальную, blastable базу данных, путем создания нескольких файлов, каждого с тем же именем как файл FASTA InputdbValue, но с различными расширениями. Файлы базы данных помещаются в то же местоположение как файл FASTA.

Примечание

Если вы переименовываете файлы базы данных, убедитесь, что у них всех есть то же имя.

blastformat(..., 'PropertyName', PropertyValue, ...) вызывает blastformat с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие.

blastformat(..., 'FormatPath', FormatPathValue, ...) задает полный путь к исполняемому файлу formatdb, включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь.

blastformat(..., 'Title', TitleValue, ...) задает заголовок для локальной базы данных. Значением по умолчанию является имя файла входа FASTA. (Это соответствует опции formatdb -t.)

Примечание

Свойство 'Title' не изменяет имя файла файлов базы данных. Этот заголовок используется внутренне только и появляется в структуре отчета, возвращенной функцией blastlocal.

blastformat(..., 'Log', LogValue, ...) задает имя файла или путь и имя файла для файла журнала, сопоставленного с локальной базой данных. Значением по умолчанию является formatdb.log. Файл журнала получает прогресс создания базы данных и форматирования. (Это соответствует опции formatdb -l.)

blastformat(..., 'Protein', ProteinValue, ...) задает, являются ли последовательности, отформатированные как локальная база данных BLAST, белком или нет. Выбором является true (значение по умолчанию) или false. (Это соответствует опции formatdb -p.)

blastformat(..., 'FormatArgs', FormatArgsValue, ...) задает опции с помощью входных параметров для функции formatdb NCBI. FormatArgsValue является вектором символов или строкой, содержащей один или несколько экземпляров -x и опции, сопоставленной с ним. Например, чтобы указать, что вход является базой данных в формате ASN.1 вместо файла FASTA, вы использовали бы следующий синтаксис:

blastformat('Inputdb', 'ecoli.asn', 'FormatArgs', '-a T')

Совет

Используйте свойство 'FormatArgs' задать опции formatdb, для которых нет никакого соответствующего имени свойства / пар значения свойства.

Примечание

Для полного списка допустимых входных параметров для функции formatdb NCBI убедитесь, что исполняемый файл formatdb расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.

formatdb -

Используя formatdb Синтаксис

Можно также использовать синтаксис и входные параметры, принятые функцией formatdb NCBI вместо имени свойства / пары значения свойства, перечисленные ранее. Для этого предоставьте вектор символов или строку, содержащую несколько опций с помощью синтаксиса option -x. Например, можно задать файл FASTA ecoli.nt, заголовок myecoli, и что последовательности не являются белком при помощи

blastformat('-i ecoli.nt -t myecoli -p F')

Примечание

Для полного списка допустимых входных параметров для функции formatdb NCBI убедитесь, что исполняемый файл formatdb расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.

formatdb -

Примеры

 Пример 1. Используя blastformat с Именем свойства / Пары Значения

Следующий пример принимает, что у вас есть файл нуклеотида FASTA, такой как E. coli файл NC_004431.fna. Для файлов FASTA от NCBI посетите ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/.

Создайте локальную blastable базу данных из файла FASTA NC_004431.fna и дайте ему заголовок с помощью свойства 'title'.

blastformat('inputdb', 'NC_004431.fna', 'protein', 'false',...
            'title', 'myecoli_nt');
 Пример 2. Используя blastformat с formatdb Синтаксисом и Входными параметрами

Создайте локальную blastable базу данных из файла FASTA NC_004431.faa и переименуйте заголовок и файл журнала с помощью синтаксиса formatdb и входных параметров.

blastformat('inputdb', 'NC_004431.faa',...
            'formatargs', '-t myecoli_aa -l ecoli_aa.log');

Ссылки

[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.

[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.

Смотрите также

| | | |

Представленный в R2007b