Создайте локальную базу данных BLAST
blastformat('Inputdb',
InputdbValue
)
blastformat(..., 'FormatPath', FormatPathValue
,
...)
blastformat(..., 'Title', TitleValue
,
...)
blastformat(..., 'Log', LogValue
,
...)
blastformat(..., 'Protein', ProteinValue
,
...)
blastformat(..., 'FormatArgs', FormatArgsValue
,
...)
InputdbValue | Вектор символов или строка, задающая имя файла или путь и имя файла файла FASTA, содержащего набор последовательностей, которые будут отформатированы как blastable база данных. Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в текущей папке. (Это соответствует опции formatdb -i .) |
FormatPathValue | Вектор символов или строка, задающая полный путь к исполняемому файлу formatdb , включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь. |
TitleValue | Вектор символов или строка, задающая заголовок для локальной базы данных. Значением по умолчанию является имя файла входа FASTA. (Это соответствует опции formatdb -t .) |
LogValue | Вектор символов или строка, задающая имя файла или путь и имя файла для файла журнала, сопоставлены с локальной базой данных. Значением по умолчанию является formatdb.log . (Это соответствует опции formatdb -l .) |
ProteinValue | Задает, являются ли последовательности, отформатированные как локальная база данных BLAST, белком или нет. Выбором является true (значение по умолчанию) или false . (Это соответствует опции formatdb -p .) |
FormatArgsValue | NCBI команда formatdb , то есть, вектор символов или строка, содержащая один или несколько экземпляров и опции, сопоставленной с ним, используемой, чтобы задать входные параметры. |
Чтобы использовать функцию blastformat
, у вас должна быть локальная копия исполняемого файла formatdb
NCBI, доступного от вашей системы. Можно загрузить исполняемый файл formatdb
путем доступа к исполняемым файлам BLAST. Запустите загруженный исполняемый файл и сконфигурируйте его для вашей системы. Для удобства рассмотрите размещение исполняемого файла formatdb
NCBI на вашем системном пути.
blastformat('Inputdb',
вызывает локальную версию исполняемого файла InputdbValue
)formatdb
NCBI с InputdbValue
, именем файла или путем и именем файла файла FASTA, содержащего набор последовательностей. Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB или в текущей папке. (Это соответствует опции formatdb
-i
.)
Это затем форматирует последовательности как локальную, blastable базу данных, путем создания нескольких файлов, каждого с тем же именем как файл FASTA InputdbValue
, но с различными расширениями. Файлы базы данных помещаются в то же местоположение как файл FASTA.
Если вы переименовываете файлы базы данных, убедитесь, что у них всех есть то же имя.
вызывает blastformat(..., 'PropertyName', PropertyValue, ...)
blastformat
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие.
blastformat(..., 'FormatPath',
задает полный путь к исполняемому файлу FormatPathValue
,
...)formatdb
, включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь.
blastformat(..., 'Title',
задает заголовок для локальной базы данных. Значением по умолчанию является имя файла входа FASTA. (Это соответствует опции TitleValue
,
...)formatdb
-t
.)
Свойство 'Title'
не изменяет имя файла файлов базы данных. Этот заголовок используется внутренне только и появляется в структуре отчета, возвращенной функцией blastlocal
.
blastformat(..., 'Log',
задает имя файла или путь и имя файла для файла журнала, сопоставленного с локальной базой данных. Значением по умолчанию является LogValue
,
...)formatdb.log
. Файл журнала получает прогресс создания базы данных и форматирования. (Это соответствует опции formatdb
-l
.)
blastformat(..., 'Protein',
задает, являются ли последовательности, отформатированные как локальная база данных BLAST, белком или нет. Выбором является ProteinValue
,
...)true
(значение по умолчанию) или false
. (Это соответствует опции formatdb
-p
.)
blastformat(..., 'FormatArgs',
задает опции с помощью входных параметров для функции FormatArgsValue
,
...)formatdb
NCBI. FormatArgsValue
является вектором символов или строкой, содержащей один или несколько экземпляров
и опции, сопоставленной с ним. Например, чтобы указать, что вход является базой данных в формате ASN.1 вместо файла FASTA, вы использовали бы следующий синтаксис:-x
blastformat('Inputdb', 'ecoli.asn', 'FormatArgs', '-a T')
Используйте свойство 'FormatArgs'
задать опции formatdb
, для которых нет никакого соответствующего имени свойства / пар значения свойства.
Для полного списка допустимых входных параметров для функции formatdb
NCBI убедитесь, что исполняемый файл formatdb
расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.
formatdb -
Можно также использовать синтаксис и входные параметры, принятые функцией formatdb
NCBI вместо имени свойства / пары значения свойства, перечисленные ранее. Для этого предоставьте вектор символов или строку, содержащую несколько опций с помощью
синтаксиса
option
. Например, можно задать файл FASTA -x
ecoli.nt
, заголовок myecoli
, и что последовательности не являются белком при помощи
blastformat('-i ecoli.nt -t myecoli -p F')
Для полного списка допустимых входных параметров для функции formatdb
NCBI убедитесь, что исполняемый файл formatdb
расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.
formatdb -
Следующий пример принимает, что у вас есть файл нуклеотида FASTA, такой как E. coli файл NC_004431.fna
. Для файлов FASTA от NCBI посетите ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/.
Создайте локальную blastable базу данных из файла FASTA NC_004431.fna
и дайте ему заголовок с помощью свойства 'title'
.
blastformat('inputdb', 'NC_004431.fna', 'protein', 'false',... 'title', 'myecoli_nt');
Создайте локальную blastable базу данных из файла FASTA NC_004431.faa
и переименуйте заголовок и файл журнала с помощью синтаксиса formatdb
и входных параметров.
blastformat('inputdb', 'NC_004431.faa',... 'formatargs', '-t myecoli_aa -l ecoli_aa.log');
[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.
[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.
blastlocal
| blastncbi
| blastread
| blastreadlocal
| getblast