Создайте удаленный ID запроса отчета BLAST NCBI или соединитесь с отчетом BLAST NCBI
blastncbi(Seq,Program)RID = blastncbi(Seq,Program)[RID,RTOE]
= blastncbi(Seq,Program)___ = blastncbi(___,Name,Value)blastncbi( отправляет запрос BLAST к NCBI против Seq,Program)Seq, нуклеотида или последовательности аминокислот, с помощью Program, заданной программы BLAST. Затем это возвращает ссылку на отчет BLAST NCBI. Для справки в выборе соответствующей программы BLAST посетите https://blast.ncbi.nlm.nih.gov/producttable.shtml.
___ = blastncbi(___, дополнительные опции использования, заданные одним или несколькими аргументами пары "имя-значение" и любым из аргументов в предыдущих синтаксисах.Name,Value)
Выполните поиск BLAST на последовательности белка и сохраните результаты в XML-файл.
Получите последовательность от Банка данных Белка и создайте структуру MATLAB.
S = getpdb('1CIV');
Используйте структуру в качестве входа для поиска BLAST с порогом значения 1e-10. Первый вывод является ID запроса, и второй вывод является предполагаемым временем (в минутах), пока поиск не завершается.
[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);
Получите результаты поиска из отчета. Можно сохранить XML-отформатированный отчет в файл для оффлайнового доступа. Используйте ROTE в качестве времени ожидания, чтобы получить результаты.
report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...
report1 =
struct with fields:
RID: 'R49TJMCF014'
Algorithm: 'BLASTP 2.6.1+'
Database: 'nr'
QueryID: 'Query_224139'
QueryDefinition: 'unnamed protein product'
Hits: [1×100 struct]
Parameters: [1×1 struct]
Statistics: [1×1 struct]
Используйте blastread, чтобы считать Показатель взрываемости из XML-отформатированного файла отчета BLAST.
blastdata = blastread('1CIV_report.xml')
blastdata =
struct with fields:
RID: ''
Algorithm: 'BLASTP 2.6.1+'
Database: 'nr'
QueryID: 'Query_224139'
QueryDefinition: 'unnamed protein product'
Hits: [1×100 struct]
Parameters: [1×1 struct]
Statistics: [1×1 struct]
Также запустите поиск BLAST с инвентарным номером NCBI.
RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =
'R49WAPMH014'
Получите результаты поиска из отчета.
report2 = getblast(RID2)
Blast results are not available yet. Please wait ...
report2 =
struct with fields:
RID: 'R49WAPMH014'
Algorithm: 'BLASTP 2.6.1+'
Database: 'nr'
QueryID: 'AAA59174.1'
QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
Hits: [1×100 struct]
Parameters: [1×1 struct]
Statistics: [1×1 struct]
Seq — Нуклеотид или последовательность аминокислотНуклеотид или последовательность аминокислот, заданная как вектор символов, строка или структура MATLAB, содержащая поле Sequence.
Если Seq является вектором символов или строкой, доступные параметры:
GenBank®, GenPept или инвентарный номер RefSeq
Имя файла FASTA
URL, указывающий на файл последовательности
Program — Программа BLASTПрограмма BLAST, заданная как одно из следующего:
'blastn' — Поисковый запрос нуклеотида по сравнению с базой данных нуклеотида.
'blastp' — Поисковый запрос белка по сравнению с базой данных белка.
'blastx' — Поиск (перевел) запрос нуклеотида по сравнению с базой данных белка.
'megablast' — Ищите очень подобные последовательности нуклеотида.
'tblastn' — Поисковый запрос белка по сравнению с переведенной базой данных нуклеотида.
'tblastx' — Поиск (перевел) запрос нуклеотида по сравнению с (переведенной) базой данных нуклеотида.
Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.
'Matrix','PAM70','Expect',1e-10 использует матрицу замены PAM70 с порогом значения для набора соответствий к 1e-10.'Database' — База данных, чтобы искать'nr' (значение по умолчанию) | вектор символов | строкаБаза данных, чтобы искать, заданный как пара, разделенная запятой, состоящая из 'Database' и вектора символов или строки.
Для баз данных нуклеотида допустимый выбор:
'nr' (значение по умолчанию)
'refseq_rna'
'refseq_genomic'
'est'
'est_human'
'est_mouse'
'est_others'
'gss'
'htgs'
'pat'
'pdb'
'alu'
'dbsts'
'chromosome'
Для баз данных белка допустимый выбор:
'nr' (значение по умолчанию)
'refseq_protein'
'swissprot'
'pat'
'pdb'
'env_nr'
Для справки в выборе соответствующей базы данных, посещения
.'MaxNumberSequences' — Максимальное количество хитов, чтобы возвратитьсяМаксимальное количество хитов, чтобы возвратиться, заданный как пара, разделенная запятой, состоящая из 'MaxNumberSequences' и положительного целого числа. Фактические результаты поиска могут иметь меньше хитов, чем, что вы задаете, в зависимости от запроса, базы данных, значения ожидания и других параметров. Значением по умолчанию является 100.
фильтр Фильтр применяется к последовательности запросаФильтр применился к последовательности запроса, заданной как пара, разделенная запятой, состоящая из 'Filter' и одно из следующего:
L Области маски низкой композиционной сложности.
R Человек маски повторяет элементы (допустимый только для blastn и megablast).
M Замаскируйте запрос при создании seed уничтожения, но не во время расширения.
'none' Никакая маска не применяется.
L Маскируют любая буква, которая является нижним регистром в запросе.
Можно задать несколько допустимых букв в односимвольном векторе или представить в виде строки, чтобы применить несколько фильтров целиком. Например, 'Lm' применяет и низкий композиционный фильтр сложности и маску.
Выбор отличается в зависимости от выбранного Program. Для получения дополнительной информации см. таблицу Choices for Optional Properties Программой BLAST.
'Expect' — Статистический порог значения для соответствий10 (значение по умолчанию) | положительное вещественное числоСтатистический порог значения для соответствий против последовательностей базы данных, заданных как пара, разделенная запятой, состоящая из 'Expect' и положительного вещественного числа. Значением по умолчанию является 10.
Можно узнать больше о статистике локального сравнения последовательности по https://blast.ncbi.nlm.nih.gov/tutorial/Altschul-1.html#head2.
Word Размер слова для последовательности запросаРазмер слова для последовательности запроса, заданной как пара, разделенная запятой, состоящая из 'Word' и положительного целого числа.
Выбор для поиска запроса белка:
2
3 (значение по умолчанию)
Выбор для поиска запроса нуклеотида:
7
11 (значение по умолчанию)
15
Выбор, когда Program установлен в 'megablast':
16
20
24
28 (значение по умолчанию)
32
48
64
128
'Matrix' — Матрица замены для последовательностей аминокислот'BLOSUM62' (значение по умолчанию) | вектор символов | строкаМатрица замены для последовательностей аминокислот, заданных как пара, разделенная запятой, состоящая из 'Matrix' и вектора символов или строки. Матрица присваивает счет к возможному выравниванию любых двух остатков аминокислоты. Выбор:
'PAM30'
'PAM70'
'BLOSUM45'
'BLOSUM62' (значение по умолчанию)
'BLOSUM80'
'MatchScores' — Соответствие и несоответствие очкам в выравнивании нуклеотидаСоответствие и несоответствие очкам в выравнивании нуклеотида, заданном как пара, разделенная запятой, состоящая из 'MatchScores' и двухэлементного числового векторного [R Q]. Первый элемент R является счетом соответствия и вторым элементом Q, является счетом несоответствия. Эта опция для blastn и megablast только.
Чтобы гарантировать точную оценку значения выравнивания, только ограниченный набор комбинаций поддерживается. См. таблицу BLAST Optional Properties для всех поддерживаемых значений. Значением по умолчанию для megablast является [1 -2], и значением по умолчанию для blastn является [1 -3].
'GapCosts' — Штрафы за открытие и расширение разрываШтрафы за открытие и расширение разрыва, заданного как пара, разделенная запятой, состоящая из 'GapCosts' и двухэлементного числового вектора. Вектор содержит два целых числа: первым является штраф за открытие разрыва, и вторым является штраф за расширение разрыва.
Допустимые затраты разрыва для blastp, blastx, tblastn и tblastx отличаются согласно матрице замены белка. Для получения дополнительной информации смотрите GapCosts для blastp, blastx, tblastn, и tblastx.
Допустимые затраты разрыва для blastn и megablast отличаются согласно MatchScores ([R Q]). Для получения дополнительной информации смотрите GapCosts для blastn и мегауничтожения.
'CompositionAdjustment' — Композиционный тип корректировки, чтобы компенсировать составы аминокислоты'none' (значение по умолчанию) | 'cbs' | 'ccsm' | 'ucsm'Композиционный тип корректировки, чтобы компенсировать составы аминокислоты последовательностей, сравниваемых, заданных как пара, разделенная запятой, состоящая из 'CompositionAdjustment' и одно из следующих значений:
'none' Никакая корректировка не применяется (значение по умолчанию).
'cbs' — Основанный на составе подход статистики используется для корректировок счета.
'ccsm' — Условная композиционная матрица счета используется для корректировок счета.
'ucsm' — Универсальная композиционная матрица счета используется для корректировок счета.
Эта опция для blastp, blastx и tblastn только. Получившиеся масштабированные очки приводят к более точным электронным значениям, чем стандартные, немасштабированные очки. Для получения дополнительной информации смотрите Композиционные корректировки.
'Entrez' — Entrez запрашивают синтаксис, чтобы искать подмножество выбранной базы данныхEntrez запрашивают синтаксис, чтобы искать подмножество выбранной базы данных, заданной как пара, разделенная запятой, состоящая из 'Entrez' и вектора символов или строки. Используйте эту опцию, чтобы ограничить поисковые запросы на основе типов молекулы, длин последовательности, организмов, и так далее. Для получения дополнительной информации об ограничении поисковых запросов см. https://blast.ncbi.nlm.nih.gov/blastcgihelp.shtml#entrez_query.
'Adv' — Расширенные настройкиРасширенные настройки, заданные как пара, разделенная запятой, состоящая из 'Adv' и вектора символов или строки. Например, чтобы задать значения вознаграждения и штрафа для соответствий нуклеотида и несоответствий, используйте '-r 1 -q -3'. Для получения дополнительной информации см. https://www.ncbi.nlm.nih.gov/blast/Doc/urlapi.html.
RID — Запросите ID для отчета BLAST NCBIЗапросите ID для отчета BLAST NCBI, возвращенного как вектор символов.
RTOE — Запросите время выполненияЗапросите время выполнения, возвращенного как целое число. Это - предполагаемое время в минутах, пока поиск не завершается.
Если вы используете функцию getblast, чтобы получить отчет BLAST, используйте эту временную оценку в качестве опции 'WaitTime'.
Выбор для дополнительных свойств программой BLAST
| Когда программа BLAST... | Затем выбор для следующих опций... | |||||
|---|---|---|---|---|---|---|
| База данных | Фильтр | Word | Матрица | MatchScores [R Q] | GapCosts | |
'blastn' | 'nr' (значение по умолчанию)'refseq_rna''refseq_genomic' 'est''est_human''est_mouse''est_others''gss''htgs''pat''pdb''alu''dbsts''chromosome' | 'Lm' (значение по умолчанию)'R''m''l''none' | 711 (значение по умолчанию)15 | — | [1 -3] (значение по умолчанию)[1 -4] [1 -2] [1 -1] [2 -3] [4 -5] | Смотрите GapCosts для blastn и мегауничтожения. |
'megablast' | 16 20 24 28 (значение по умолчанию)32 48 64 128 | [1 -3]
[1 -4] [1 -2] (значение по умолчанию)[1 -1] [2 -3] [4 -5] | ||||
'tblastn' | 'L' (значение по умолчанию)'m''l''none' | 23 (значение по умолчанию) | 'PAM30''PAM70''BLOSUM45''BLOSUM62' (значение по умолчанию)'BLOSUM80'
| – | Смотрите GapCosts для blastp, blastx, tblastn, и tblastx. | |
'tblastx' | ||||||
'blastp' | 'nr' (значение по умолчанию)'refseq_protein''swissprot''pat''pdb''env_nr' | 'L'
'm''l''none' (значение по умолчанию) | ||||
'blastx' | 'L' (значение по умолчанию)'m''l''none' | |||||
GapCosts для blastp, blastx, tblastn и tblastx
| Матрица замены | Допустимые значения 'GapCosts' |
|---|---|
'PAM30' | [7 2] [6 2] [5 2] [10 1] [9 1] (значение по умолчанию)[8 1] |
'PAM70' | [8 2] [7 2] [6 2] [11 1] [10 1] (значение по умолчанию)[9 1] |
'BLOSUM80' | |
'BLOSUM45' | [13 3] [12 3] [11 3] [10 3] [15 2] (значение по умолчанию)[14 2] [13 2] [12 2] [19 1] [18 1] [17 1] [16 1] |
'BLOSUM62' | [9 2] [8 2] [7 2] [12 1] [11 1] (значение по умолчанию)[10 1] |
GapCosts для blastn и megablast
| MatchScores [R Q] | Допустимые значения 'GapCosts' |
|---|---|
| [1 -4] | [5 2] (значение по умолчанию) [1 2] [0 2] [2 1] [1 1] |
| [1 -3] | [5 2] (значение по умолчанию)[2 2] [1 2] [0 2] [2 1] [1 1] |
| [1 -2] | [5 2] (значение по умолчанию)[2 2] [1 2] [0 2] [3 1] [2 1] [1 1] |
| [1 -1] | [5 2] (значение по умолчанию)[3 2] [2 2] [1 2] [0 2] [4 1] [3 1] [2 1] |
| [2 -3] | [5 2] (значение по умолчанию)[4 4] [2 4] [0 4] [3 3] [6 2] [4 2] [2 2] |
| [4 -5] | [5 2] (значение по умолчанию)[6 5] [5 5] [4 5] [3 5] |
Ошибки, запускающиеся в R2017b
Программа BLAST 'psiblast' была удалена из одной из поддерживаемых программ.
Ошибки, запускающиеся в R2017b
Пара "имя-значение" 'Inclusion' была удалена, поскольку она только применяется к программе psiblast, которая была также удалена.
Ошибки, запускающиеся в R2017b
Пара "имя-значение" 'Descriptions' была удалена. Используйте 'MaxNumberSequences' вместо этого, чтобы задать максимальное количество хитов, чтобы возвратиться.
Ошибки, запускающиеся в R2017b
Пара "имя-значение" 'Alignments' была удалена. Используйте 'MaxNumberSequences' вместо этого, чтобы задать максимальное количество хитов, чтобы возвратиться.
Ошибки, запускающиеся в R2017b
Пара "имя-значение" 'GapOpen' была удалена. Используйте 'GapCosts' вместо этого.
Ошибки, запускающиеся в R2017b
Пара "имя-значение" 'ExtendGap' была удалена. Используйте 'GapCosts' вместо этого.
Ошибки, запускающиеся в R2017b
Пара "имя-значение" 'Pct' была удалена.
[1] Altschul, S.F., В. Джиш, В. Миллер, Э.В. Майерс и Д.Дж. Липмен (1990). "Основное локальное средство поиска выравнивания". J. Молекулярная масса Biol. 215, 403–410.
[2] Altschul, S.F., Т.Л. Мэдден, А.А. Шеффер, Цз. Чжан, Цз. Чжан, В. Миллер и Д. Дж. Липмен (1997). "Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы". Нуклеиновые кислоты Res. 25, 3389–3402.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.