Выполните поиск на локальной базе данных BLAST, чтобы создать отчет BLAST
blastlocal('InputQuery',
InputQueryValue
)
Data
= blastlocal('InputQuery', InputQueryValue
)
... blastlocal(..., 'Program', ProgramValue
,
...)
... blastlocal(..., 'Database', DatabaseValue
,
...)
... blastlocal(..., 'BlastPath', BlastPathValue
,
...)
... blastlocal(..., 'Expect', ExpectValue
,
...)
... blastlocal(..., 'Format', FormatValue
,
...)
... blastlocal(..., 'ToFile', ToFileValue
,
...)
... blastlocal(..., 'Filter', FilterValue
,
...)
... blastlocal(..., 'GapOpen', GapOpenValue
,
...)
... blastlocal(..., 'GapExtend', GapExtendValue
,
...)
... blastlocal(..., 'BLASTArgs', BLASTArgsValue
,
...)
InputQueryValue | Вектор символов или строка, задающая имя файла или путь и имя файла файла FASTA, содержащего нуклеотид запроса или последовательность (последовательности) аминокислот. (Это соответствует опции blastall -i .) |
ProgramValue | Вектор символов или строка, задающая программу BLAST. Выбор:
(Аргумент |
DatabaseValue | Вектор символов или строка, задающая имя файла или путь и имя файла локальной базы данных BLAST (отформатированное использование функции formatdb NCBI), чтобы искать. Значением по умолчанию является локальная версия базы данных nr в текущей папке MATLAB®. (Это соответствует опции blastall -d .) |
BlastPathValue | Вектор символов или строка, задающая полный путь к исполняемому файлу blastall , включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь. |
ExpectValue | Значение, задающее статистический порог значения для соответствий против последовательностей базы данных. Выбором является любое вещественное число. Значением по умолчанию является 10 . (Это соответствует опции blastall -e .) |
FormatValue | Целое число, задающее формат выравнивания результатов поиска BLAST. Выбор:
(Это соответствует опции |
ToFileValue | Вектор символов или строка, задающая имя файла или путь и имя файла, в котором можно сохранить содержимое отчета BLAST. (Это соответствует опции blastall -o .) |
FilterValue | Управляет применением фильтра (фильтр DUST для blastn программы или фильтр SEG для других программ) к последовательности (последовательностям) запроса. Выбором является true (значение по умолчанию) или false . (Это соответствует опции blastall -F .) |
GapOpenValue | Целое число, которое задает штраф за открытие разрыва в выравнивании последовательностей. Значением по умолчанию является -1 . (Это соответствует опции blastall -G .) |
GapExtendValue | Целое число, которое задает штраф за расширение разрыва в выравнивании последовательностей. Значением по умолчанию является -1 . (Это соответствует опции blastall -E .) |
BLASTArgsValue | NCBI команда blastall , которая является вектором символов или строкой, содержащей один или несколько экземпляров и опции, сопоставленной с ним, раньше задавал входные параметры. |
Data | Структура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST. |
Основное локальное средство поиска выравнивания (BLAST) предлагает быстрый и мощный сравнительный анализ белка и последовательностей нуклеотида против известных последовательностей в онлайновых или локальных базах данных.
Чтобы использовать функцию blastlocal
, у вас должна быть локальная копия исполняемого файла blastall
NCBI (версия 2.2.17), доступная от вашей системы. Запустите загруженный исполняемый файл и сконфигурируйте его для вашей системы. Для удобства рассмотрите размещение исполняемого файла blastall
NCBI на вашем системном пути.
blastlocal('InputQuery',
представляет последовательность (последовательности) запроса, заданную InputQueryValue
)InputQueryValue
, файл FASTA, содержащий нуклеотид или последовательность (последовательности) аминокислот, для поиска BLAST локальной базы данных BLAST, путем вызова локальной версии исполняемого файла blastall
NCBI. Результаты поиска BLAST отображены в Окне Команды MATLAB. (Это соответствует опции blastall
-i
.)
возвращает результаты поиска BLAST в Data
= blastlocal('InputQuery', InputQueryValue
)Data
, структуре MATLAB или массиве структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST, и данные из локального BLAST сообщают.
Data
содержит подмножество следующих полей, на основе заданного формата выравнивания.
Поле | Описание |
---|---|
Algorithm | Алгоритм NCBI раньше делал поиск BLAST. |
Query | Идентификатор последовательности запроса подвергается поиску BLAST. |
Length | Длина последовательности запроса. |
Database | Все базы данных ищутся. |
Hits.Name | Имя последовательности базы данных (подвергают последовательность), который совпадал с последовательностью запроса. |
Hits.Score | Счет выравнивания между последовательностью запроса и подчиненной последовательностью. |
Hits.Expect | Значение ожидания для выравнивания между последовательностью запроса и подчиненной последовательностью. |
Hits.Length | Длина подчиненной последовательности. |
Hits.HSPs.Score |
Попарный счет выравнивания к высоко выигрывающей паре последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Expect | Значение ожидания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Identities | Тождества (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Positives | Идентичные или подобные остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот. ПримечаниеЭто поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и/или базам данных.
|
Hits.HSPs.Gaps | Неприсоединившиеся остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Mismatches | Остатки, которые не подобны друг другу (соответствие, возможны, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Frame | Рамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.ПримечаниеЭто поле применяется только, когда выполнение перевело поисковые запросы, то есть, при использовании |
Hits.HSPs.Strand | Смысл (Plus = 5' к 3' и Minus = 3' к 5') нитей ДНК для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. ПримечаниеЭто поле применяется только при использовании последовательности запроса нуклеотида и базы данных. |
Hits.HSPs.Alignment | Матрица с тремя строками, показывающая выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.QueryIndices | Индексы положений остатка последовательности запроса для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.SubjectIndices | Индексы подчиненных положений остатка последовательности для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.AlignmentLength | Продолжительность попарного выравнивания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Alignment | Целое выравнивание для последовательности запроса и подчиненной последовательности (последовательностей). |
Statistics | Сводные данные статистических деталей о выполняемом поиске, таких как значения lambda, разрывают штрафы, количество последовательностей, искавших и количество хитов. |
вызывает ... blastlocal(..., 'PropertyName', PropertyValue, ...)
blastlocal
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие.
... blastlocal(..., 'Program',
задает программу BLAST. Выбором является ProgramValue
,
...)'blastp'
(значение по умолчанию), 'blastn'
, 'blastx'
, 'tblastn'
и 'tblastx'
. (Это соответствует опции blastall
-p
.) Для справки в выборе соответствующей программы BLAST, посещения:
... blastlocal(..., 'Database',
задает локальную базу данных BLAST (отформатированное использование функции DatabaseValue
,
...)formatdb
NCBI), чтобы искать. Значением по умолчанию является локальная версия базы данных nr
в текущей папке MATLAB. (Это соответствует опции blastall
-d
.)
... blastlocal(..., 'BlastPath',
задает полный путь к исполняемому файлу BlastPathValue
,
...)blastall
, включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь.
... blastlocal(..., 'Expect',
задает статистический порог значения для соответствий против последовательностей базы данных. Выбором является любое вещественное число. Значением по умолчанию является ExpectValue
,
...)10
. (Это соответствует опции blastall
-e
.) Можно узнать больше о статистике локального сравнения последовательности в:
... blastlocal(..., 'Format',
задает формат выравнивания результатов поиска BLAST. Выбор:FormatValue
,
...)
0
(значение по умолчанию) — Попарно
1
— Привязанные запросом, показывающие тождества
2
— Привязанный запросом, никакие тождества
3
— Плоские привязанные запросом, показывающие тождества
4
— Плоский привязанный запросом, никакие тождества
5
— Привязанный запросом, никакие тождества и тупые концы
6
— Плоский привязанный запросом, никакие тождества и тупые концы
7
— Не используемый
8
— Табличный
9
— Табличный со строками с комментариями
(Это соответствует опции blastall
-m
.)
... blastlocal(..., 'ToFile',
сохраняет содержимое BLAST, сообщают заданному файлу. (Это соответствует опции ToFileValue
,
...)blastall
-o
.)
... blastlocal(..., 'Filter',
задает, применяется ли фильтр (фильтр DUST для blastn программы или фильтр SEG для других программ) к последовательности (последовательностям) запроса. Выбором является FilterValue
,
...)true
(значение по умолчанию) или false
. (Это соответствует опции blastall
-F
.)
... blastlocal(..., 'GapOpen',
задает штраф за открытие разрыва в выравнивании последовательностей. Значением по умолчанию является GapOpenValue
,
...)-1
. (Это соответствует опции blastall
-G
.)
... blastlocal(..., 'GapExtend',
задает штраф за расширение разрыва в выравнивании последовательностей. Значением по умолчанию является GapExtendValue
,
...)-1
. (Это соответствует опции blastall
-E
.)
... blastlocal(..., 'BLASTArgs',
задает опции с помощью входных параметров для функции BLASTArgsValue
,
...)blastall
NCBI. BLASTArgsValue
является вектором символов или строкой, содержащей один или несколько экземпляров или
и опция, сопоставленная с ним. Например, чтобы задать матрицу -x
BLOSUM 45
, вы использовали бы следующий синтаксис:
blastlocal('InputQuery', ecoliquery.txt, 'BLASTArgs', '-M BLOSUM45')
Используйте свойство 'BlastArgs'
задать опции blastall
, для которых нет никакого соответствующего имени свойства / пар значения свойства.
Для полного списка допустимых входных параметров для функции blastall
NCBI убедитесь, что исполняемый файл blastall
расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.
blastall -
Можно также использовать синтаксис и входные параметры, принятые функцией blastall
NCBI вместо имени свойства / пары значения свойства, перечисленные ранее. Для этого предоставьте вектор символов или строку, содержащую несколько опций с помощью
синтаксиса
option
. Например, можно задать файл FASTA -x
ecoliquery.txt
как последовательности запроса, программу blastp
и локальную базу данных ecoli
, при помощи
blastlocal('-i ecoliquery.txt -p blastp -d ecoli')
Для полного списка допустимых входных параметров для функции blastall
NCBI убедитесь, что исполняемый файл blastall
расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.
blastall -
Следующие примеры принимают, что у вас есть файл нуклеотида FASTA и файл аминокислоты FASTA для E. coli, такого как файлы NC_004431.fna
и NC_004431.faa
, сохраненный в вашу текущую папку MATLAB.
Создайте локальные blastable базы данных из NC_004431.fna
и NC_004431.faa
файлы FASTA при помощи функции blastformat
.
blastformat('inputdb', 'NC_004431.fna
', 'protein', 'false');
blastformat('inputdb', 'NC_004431.faa');
Используйте функцию getgenbank
, чтобы получить информацию о последовательности для E. coli оперон треонина от базы данных GenBank®.
S = getgenbank('M28570');
Создайте файл запроса при помощи функции fastawrite
, чтобы создать файл с именем FASTA query_nt.fa
из этой информации о последовательности, с помощью только инвентарный номер в качестве заголовка.
S.Header = S.Accession; fastawrite('query_nt.fa', S);
Используйте синтаксис MATLAB, чтобы представить последовательность запроса в файле FASTA query_nt.fa
для поиска BLAST локальной базы данных NC_004431.faa
аминокислоты. Задайте программу BLAST blastx
. Возвратите результаты поиска BLAST в results
, структуре MATLAB.
results = blastlocal('inputquery', 'query_nt.fa',... 'database', 'NC_004431.faa',... 'program', 'blastx');
Если вы уже не сделали так, создайте локальные blastable базы данных и файл запроса, как описано ранее.
Используйте синтаксис blastall
, чтобы представить последовательность запроса в файле FASTA query_nt.fa
для поиска BLAST локальной базы данных NC_004431.fna
нуклеотида. Задайте программу BLAST blastn
и значение ожидания 0.0001
. Возвратите результаты поиска BLAST в results
, структуре MATLAB.
results = blastlocal('-i query_nt.fa -d NC_004431.fna ... -p blastn -e 0.0001');
Если вы уже не сделали так, создайте локальные blastable базы данных и файл запроса, как описано ранее.
Представьте последовательность запроса в файле FASTA query_nt.fa
для поиска BLAST локальной базы данных NC_004431.fna
нуклеотида. Задайте программу BLAST blastn
и табличный формат выравнивания. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt.txt
.
blastlocal('inputquery', 'query_nt.fa',... 'database', 'NC_004431.fna', 'tofile',... 'myecoli_nt.txt', 'blastargs', '-p blastn -m 8');
[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.
[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.
blastformat
| blastncbi
| blastread
| blastreadlocal
| getblast