Создайте удаленный ID запроса отчета BLAST NCBI или соединитесь с отчетом BLAST NCBI
blastncbi(
отправляет запрос BLAST к NCBI против Seq
,Program
)Seq
, нуклеотид или последовательность аминокислот, с помощью Program
, заданная программа BLAST. Затем это возвращает ссылку на отчет BLAST NCBI. Для справки в выборе соответствующей программы BLAST посетите https://blast.ncbi.nlm.nih.gov/producttable.shtml.
___ = blastncbi(___,
дополнительные опции использования, заданные одним или несколькими аргументами пары "имя-значение" и любым из аргументов в предыдущих синтаксисах.Name,Value
)
Выполните поиск BLAST на последовательности белка и сохраните результаты в XML-файл.
Получите последовательность от Банка данных Белка и создайте структуру MATLAB.
S = getpdb('1CIV');
Используйте структуру в качестве входа для поиска BLAST с порогом значения 1e-10
. Первый выход является ID запроса, и второй выход является предполагаемым временем (в минутах), пока поиск не завершается.
[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);
Получите результаты поиска из отчета. Можно сохранить XML-отформатированный отчет в файл для оффлайнового доступа. Используйте ROTE в качестве времени ожидания, чтобы получить результаты.
report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ... report1 = struct with fields: RID: 'R49TJMCF014' Algorithm: 'BLASTP 2.6.1+' Database: 'nr' QueryID: 'Query_224139' QueryDefinition: 'unnamed protein product' Hits: [1×100 struct] Parameters: [1×1 struct] Statistics: [1×1 struct]
Используйте blastread
чтобы считать Показатель взрываемости из XML-отформатированного BLAST сообщают о файле.
blastdata = blastread('1CIV_report.xml')
blastdata = struct with fields: RID: '' Algorithm: 'BLASTP 2.6.1+' Database: 'nr' QueryID: 'Query_224139' QueryDefinition: 'unnamed protein product' Hits: [1×100 struct] Parameters: [1×1 struct] Statistics: [1×1 struct]
В качестве альтернативы запустите поиск BLAST с инвентарным номером NCBI.
RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 = 'R49WAPMH014'
Получите результаты поиска из отчета.
report2 = getblast(RID2)
Blast results are not available yet. Please wait ... report2 = struct with fields: RID: 'R49WAPMH014' Algorithm: 'BLASTP 2.6.1+' Database: 'nr' QueryID: 'AAA59174.1' QueryDefinition: 'insulin receptor precursor [Homo sapiens]' Hits: [1×100 struct] Parameters: [1×1 struct] Statistics: [1×1 struct]
Seq
— Нуклеотид или последовательность аминокислотНуклеотид или последовательность аминокислот в виде вектора символов, строки или структуры MATLAB, содержащей Sequence
поле .
Если Seq
вектор символов или строка, доступные параметры:
GenBank®, GenPept или инвентарный номер RefSeq
Имя файла FASTA
URL, указывающий на файл последовательности
Program
— Программа BLASTПрограмма BLAST в виде одного из следующего:
'blastn'
— Поисковый запрос нуклеотида по сравнению с базой данных нуклеотида.
'blastp'
— Поисковый запрос белка по сравнению с базой данных белка.
'blastx'
— Поиск (перевел) запрос нуклеотида по сравнению с базой данных белка.
'megablast'
— Ищите очень подобные последовательности нуклеотида.
'tblastn'
— Поисковый запрос белка по сравнению с переведенной базой данных нуклеотида.
'tblastx'
— Поиск (перевел) запрос нуклеотида по сравнению с (переведенной) базой данных нуклеотида.
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
'Matrix','PAM70','Expect',1e-10
использует PAM70
матрица замены с порогом значения для набора соответствий к 1e-10.'Database'
— База данных, чтобы искать'nr'
(значение по умолчанию) | вектор символов | строкаБаза данных, чтобы искать в виде разделенной запятой пары, состоящей из 'Database'
и вектор символов или строка.
Для баз данных нуклеотида допустимый выбор:
'nr'
(значение по умолчанию)
'refseq_rna'
'refseq_genomic'
'est'
'est_human'
'est_mouse'
'est_others'
'gss'
'htgs'
'pat'
'pdb'
'alu'
'dbsts'
'chromosome'
Для баз данных белка допустимый выбор:
'nr'
(значение по умолчанию)
'refseq_protein'
'swissprot'
'pat'
'pdb'
'env_nr'
Примечание
Доступные базы данных могут измениться. Проверяйте веб-сайт NCBI для получения дополнительной информации.
Для справки в выборе соответствующей базы данных, посещения
.'MaxNumberSequences'
— Максимальное количество хитов, чтобы возвратитьсяМаксимальное количество хитов, чтобы возвратиться в виде разделенной запятой пары, состоящей из 'MaxNumberSequences'
и положительное целое число. Фактические результаты поиска могут иметь меньше хитов, чем, что вы задаете, в зависимости от запроса, базы данных, значения ожидания и других параметров. Значением по умолчанию является 100
.
'Filter'
— Фильтр применяется к последовательности запросаФильтр применился к последовательности запроса в виде разделенной запятой пары, состоящей из 'Filter'
и одно из следующего:
'L'
— Области маски низкой композиционной сложности.
'R'
— Человек маски повторяет элементы (допустимый для blastn
и megablast
только).
'm'
— Замаскируйте запрос при создании seed уничтожения, но не во время расширения.
'none'
— Никакая маска не применяется.
'l'
— Маскируют любая буква, которая является нижним регистром в запросе.
Можно задать несколько допустимых букв в односимвольном векторе или представить в виде строки, чтобы применить несколько фильтров целиком. Например, 'Lm'
применяет и низкий композиционный фильтр сложности и маску.
Выбор варьируется в зависимости от выбранного Program
. Для получения дополнительной информации см. таблицу Choices for Optional Properties Программой BLAST.
'Expect'
— Статистический порог значения для соответствий
(значение по умолчанию) | положительное вещественное числоСтатистический порог значения для соответствий против последовательностей базы данных в виде разделенной запятой пары, состоящей из 'Expect'
и положительное вещественное число. Значением по умолчанию является 10
.
Можно узнать больше о статистике локального сравнения последовательности в https://blast.ncbi.nlm.nih.gov/tutorial/Altschul-1.html#head2.
'Word'
— Размер слова для последовательности запросаРазмер слова для последовательности запроса в виде разделенной запятой пары, состоящей из 'Word'
и положительное целое число.
Выбор для поиска запроса белка:
2
3 (значение по умолчанию)
Выбор для поиска запроса нуклеотида:
7
11 (значение по умолчанию)
15
Выбор, когда Program
установлен в 'megablast'
:
16
20
24
28 (значение по умолчанию)
32
48
64
128
'Matrix'
— Матрица замены для последовательностей аминокислот'BLOSUM62'
(значение по умолчанию) | вектор символов | строкаМатрица замены для последовательностей аминокислот в виде разделенной запятой пары, состоящей из 'Matrix'
и вектор символов или строка. Матрица присваивает счет к возможному выравниванию любых двух остатков аминокислоты. Выбор:
'PAM30'
'PAM70'
'BLOSUM45'
'BLOSUM62'
(значение по умолчанию)
'BLOSUM80'
'MatchScores'
— Соответствие и несоответствие баллам в выравнивании нуклеотидаСоответствие и несоответствие баллам в выравнивании нуклеотида в виде разделенной запятой пары, состоящей из 'MatchScores'
и двухэлементный числовой векторный [R Q]
. Первый элемент R
счет соответствия и второй элемент Q
счет несоответствия. Эта опция для blastn
и megablast
только.
Чтобы гарантировать точную оценку значения выравнивания, только ограниченный набор комбинаций поддерживается. См. таблицу BLAST Optional Properties для всех поддерживаемых значений. Значение по умолчанию для megablast
[1 -2]
, и значение по умолчанию для blastn
[1 -3]
.
'GapCosts'
— Штрафы за открытие и расширение разрываШтрафы за открытие и расширение разрыва в виде разделенной запятой пары, состоящей из 'GapCosts'
и двухэлементный числовой вектор. Вектор содержит два целых числа: первым является штраф за открытие разрыва, и вторым является штраф за расширение разрыва.
Допустимый разрыв стоит за blastp
, blastx
, tblastn
, и tblastx
варьируйтесь согласно матрице замены белка. Для получения дополнительной информации смотрите GapCosts для blastp, blastx, tblastn, и tblastx.
Допустимый разрыв стоит за blastn
и megablast
варьируйтесь согласно MatchScores
([R Q]
). Для получения дополнительной информации смотрите GapCosts для blastn и мегауничтожения.
'CompositionAdjustment'
— Композиционный тип корректировки, чтобы компенсировать составы аминокислоты'none'
(значение по умолчанию) | 'cbs'
| 'ccsm'
| 'ucsm'
Композиционный тип корректировки, чтобы компенсировать составы аминокислоты последовательностей, сравниваемых в виде разделенной запятой пары, состоящей из 'CompositionAdjustment'
и одно из следующих значений:
'none'
— Никакая корректировка не применяется (значение по умолчанию).
'cbs'
— Основанный на составе подход статистики используется для корректировок счета.
'ccsm'
— Условная композиционная матрица счета используется для корректировок счета.
'ucsm'
— Универсальная композиционная матрица счета используется для корректировок счета.
Эта опция для blastp
, blastx
, и tblastn
только. Получившиеся масштабированные баллы дают к более точным электронным значениям, чем стандартные, немасштабированные баллы. Для получения дополнительной информации смотрите Композиционные корректировки.
'Entrez'
— Entrez запрашивают синтаксис, чтобы искать подмножество выбранной базы данныхEntrez запрашивают синтаксис, чтобы искать подмножество выбранной базы данных в виде разделенной запятой пары, состоящей из 'Entrez'
и вектор символов или строка. Используйте эту опцию, чтобы ограничить поисковые запросы на основе типов молекулы, длин последовательности, организмов, и так далее. Для получения дополнительной информации об ограничении поисковых запросов см. https://blast.ncbi.nlm.nih.gov/blastcgihelp.shtml#entrez_query.
'Adv'
— Расширенные настройкиРасширенные настройки в виде разделенной запятой пары, состоящей из 'Adv'
и вектор символов или строка. Например, чтобы задать значения вознаграждения и штрафа для соответствий нуклеотида и несоответствий, используйте '-r 1 -q -3'
. Для получения дополнительной информации см. https://www.ncbi.nlm.nih.gov/blast/Doc/urlapi.html.
'TimeOut'
— Тайм-аут связиТайм-аут связи (в секундах), чтобы представить BLAST запрашивает в виде положительной скалярной величины. Для получения дополнительной информации смотрите здесь.
Типы данных: double
RID
— Запросите ID для отчета BLAST NCBIЗапросите ID для отчета BLAST NCBI, возвращенного как вектор символов.
RTOE
— Запросите время выполненияЗапросите время выполнения, возвращенного как целое число. Это - предполагаемое время в минутах, пока поиск не завершается.
Совет
Если вы используете getblast
функция, чтобы получить отчет BLAST, используйте эту временную оценку в качестве 'WaitTime'
опция.
Выбор для дополнительных свойств программой BLAST
Когда программа BLAST... | Затем выбор для следующих опций... | |||||
---|---|---|---|---|---|---|
База данных | Фильтр | Word | Матрица | MatchScores [R Q] | GapCosts | |
'blastn' | 'nr' (значение по умолчанию)'refseq_rna' 'refseq_genomic' 'est' 'est_human' 'est_mouse' 'est_others' 'gss' 'htgs' 'pat' 'pdb' 'alu' 'dbsts' 'chromosome' | 'Lm' (значение по умолчанию)'R' 'm' 'l' 'none' | 7
11 (значение по умолчанию)15
| — | [1 -3] (значение по умолчанию)[1 -4]
[1 -2]
[1 -1]
[2 -3]
[4 -5]
| Смотрите GapCosts для blastn и мегауничтожения. |
'megablast' | 16
20
24
28 (значение по умолчанию)32
48
64
128
| [1 -3]
[1 -4]
[1 -2] (значение по умолчанию)[1 -1]
[2 -3]
[4 -5]
| ||||
'tblastn' | 'L' (значение по умолчанию)'m' 'l' 'none' | 2
3 (значение по умолчанию) | 'PAM30' 'PAM70' 'BLOSUM45' 'BLOSUM62' (значение по умолчанию)'BLOSUM80'
| – | Смотрите GapCosts для blastp, blastx, tblastn, и tblastx. | |
'tblastx' | ||||||
'blastp' | 'nr' (значение по умолчанию)'refseq_protein' 'swissprot' 'pat' 'pdb' 'env_nr' | 'L'
'm' 'l' 'none' (значение по умолчанию) | ||||
'blastx' | 'L' (значение по умолчанию)'m' 'l' 'none' |
GapCosts для blastp
, blastx
, tblastn
, и tblastx
Матрица замены | Допустимый 'GapCosts' Значения |
---|---|
'PAM30' | [7 2]
[6 2]
[5 2]
[10 1]
[9 1] (значение по умолчанию)[8 1]
|
'PAM70' | [8 2]
[7 2]
[6 2]
[11 1]
[10 1] (значение по умолчанию)[9 1]
|
'BLOSUM80' | |
'BLOSUM45' | [13 3]
[12 3]
[11 3]
[10 3]
[15 2] (значение по умолчанию)[14 2]
[13 2]
[12 2]
[19 1]
[18 1]
[17 1]
[16 1]
|
'BLOSUM62' | [9 2]
[8 2]
[7 2]
[12 1]
[11 1] (значение по умолчанию)[10 1]
|
GapCosts для blastn
и megablast
MatchScores [R Q] | Допустимый 'GapCosts' Значения |
---|---|
[1 -4]
| [5 2] (значение по умолчанию) [1 2]
[0 2]
[2 1]
[1 1]
|
[1 -3]
| [5 2] (значение по умолчанию)[2 2]
[1 2]
[0 2]
[2 1]
[1 1]
|
[1 -2]
| [5 2] (значение по умолчанию)[2 2]
[1 2]
[0 2]
[3 1]
[2 1]
[1 1]
|
[1 -1]
| [5 2] (значение по умолчанию)[3 2]
[2 2]
[1 2]
[0 2]
[4 1]
[3 1]
[2 1]
|
[2 -3]
| [5 2] (значение по умолчанию)[4 4]
[2 4]
[0 4]
[3 3]
[6 2]
[4 2]
[2 2]
|
[4 -5]
| [5 2] (значение по умолчанию)[6 5]
[5 5]
[4 5]
[3 5]
|
'psiblast'
Программа BLAST была удаленаОшибки, запускающиеся в R2017b
Программа BLAST 'psiblast'
был удален из одной из поддерживаемых программ.
'Inclusion'
опция была удаленаОшибки, запускающиеся в R2017b
'Inclusion'
пара "имя-значение" была удалена, поскольку она только применяется к psiblast
программа, которая была также удалена.
'Descriptions'
опция была удаленаОшибки, запускающиеся в R2017b
'Descriptions'
пара "имя-значение" была удалена. Используйте 'MaxNumberSequences'
вместо этого задавать максимальное количество хитов, чтобы возвратиться.
'Alignments'
опция была удаленаОшибки, запускающиеся в R2017b
'Alignments'
пара "имя-значение" была удалена. Используйте 'MaxNumberSequences'
вместо этого задавать максимальное количество хитов, чтобы возвратиться.
'GapOpen'
опция была удаленаОшибки, запускающиеся в R2017b
'GapOpen'
пара "имя-значение" была удалена. Используйте 'GapCosts'
вместо этого.
'ExtendGap'
опция была удаленаОшибки, запускающиеся в R2017b
'ExtendGap'
пара "имя-значение" была удалена. Используйте 'GapCosts'
вместо этого.
'Pct'
опция была удаленаОшибки, запускающиеся в R2017b
'Pct'
пара "имя-значение" была удалена.
[1] Altschul, S.F., В. Джиш, В. Миллер, Э.В. Майерс и Д.Дж. Липмен (1990). "Основное локальное средство поиска выравнивания". J. Молекулярная масса Biol. 215, 403–410.
[2] Altschul, S.F., Т.Л. Мэдден, А.А. Шеффер, Цз. Чжан, Цз. Чжан, В. Миллер и Д. Дж. Липмен (1997). "Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы". Нуклеиновые кислоты Res. 25, 3389–3402.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.