blastncbi

Создайте удаленный ID запроса отчета BLAST NCBI или соединитесь с отчетом BLAST NCBI

Синтаксис

blastncbi(Seq,Program)
RID = blastncbi(Seq,Program)
[RID,RTOE] = blastncbi(Seq,Program)
___ = blastncbi(___,Name,Value)

Описание

пример

blastncbi(Seq,Program) отправляет запрос BLAST к NCBI против Seq, нуклеотида или последовательности аминокислот, с помощью Program, заданной программы BLAST. Затем это возвращает ссылку на отчет BLAST NCBI. Для справки в выборе соответствующей программы BLAST посетите https://blast.ncbi.nlm.nih.gov/producttable.shtml.

пример

RID = blastncbi(Seq,Program) возвращает RID, ID Запроса для отчета.

пример

[RID,RTOE] = blastncbi(Seq,Program) возвращает и RID, ID Запроса для отчета BLAST NCBI и RTOE, Время Запроса Выполнения, которое является предполагаемым временем, необходимым для поиска, чтобы закончиться.

пример

___ = blastncbi(___,Name,Value) дополнительные опции использования, заданные одним или несколькими аргументами пары "имя-значение" и любым из аргументов в предыдущих синтаксисах.

Примеры

свернуть все

Выполните поиск BLAST на последовательности белка и сохраните результаты в XML-файл.

Получите последовательность от Банка данных Белка и создайте структуру MATLAB.

S = getpdb('1CIV');

Используйте структуру в качестве входа для поиска BLAST с порогом значения 1e-10. Первый вывод является ID запроса, и второй вывод является предполагаемым временем (в минутах), пока поиск не завершается.

[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);

Получите результаты поиска из отчета. Можно сохранить XML-отформатированный отчет в файл для оффлайнового доступа. Используйте ROTE в качестве времени ожидания, чтобы получить результаты.

report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...

report1 = 

  struct with fields:

                RID: 'R49TJMCF014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Используйте blastread, чтобы считать Показатель взрываемости из XML-отформатированного файла отчета BLAST.

blastdata = blastread('1CIV_report.xml')
blastdata = 

  struct with fields:

                RID: ''
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Также запустите поиск BLAST с инвентарным номером NCBI.

RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =

    'R49WAPMH014'

Получите результаты поиска из отчета.

report2 = getblast(RID2)
Blast results are not available yet. Please wait ...

report2 = 

  struct with fields:

                RID: 'R49WAPMH014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'AAA59174.1'
    QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Входные параметры

свернуть все

Нуклеотид или последовательность аминокислот, заданная как вектор символов, строка или структура MATLAB, содержащая поле Sequence.

Если Seq является вектором символов или строкой, доступные параметры:

  • GenBank®, GenPept или инвентарный номер RefSeq

  • Имя файла FASTA

  • URL, указывающий на файл последовательности

Программа BLAST, заданная как одно из следующего:

  • 'blastn' — Поисковый запрос нуклеотида по сравнению с базой данных нуклеотида.

  • 'blastp' — Поисковый запрос белка по сравнению с базой данных белка.

  • 'blastx' — Поиск (перевел) запрос нуклеотида по сравнению с базой данных белка.

  • 'megablast' — Ищите очень подобные последовательности нуклеотида.

  • 'tblastn' — Поисковый запрос белка по сравнению с переведенной базой данных нуклеотида.

  • 'tblastx' — Поиск (перевел) запрос нуклеотида по сравнению с (переведенной) базой данных нуклеотида.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Matrix','PAM70','Expect',1e-10 использует матрицу замены PAM70 с порогом значения для набора соответствий к 1e-10.

База данных, чтобы искать, заданный как пара, разделенная запятой, состоящая из 'Database' и вектора символов или строки.

Для баз данных нуклеотида допустимый выбор:

  • 'nr' (значение по умолчанию)

  • 'refseq_rna'

  • 'refseq_genomic'

  • 'est'

  • 'est_human'

  • 'est_mouse'

  • 'est_others'

  • 'gss'

  • 'htgs'

  • 'pat'

  • 'pdb'

  • 'alu'

  • 'dbsts'

  • 'chromosome'

Для баз данных белка допустимый выбор:

  • 'nr' (значение по умолчанию)

  • 'refseq_protein'

  • 'swissprot'

  • 'pat'

  • 'pdb'

  • 'env_nr'

Для справки в выборе соответствующей базы данных, посещения

.

Максимальное количество хитов, чтобы возвратиться, заданный как пара, разделенная запятой, состоящая из 'MaxNumberSequences' и положительного целого числа. Фактические результаты поиска могут иметь меньше хитов, чем, что вы задаете, в зависимости от запроса, базы данных, значения ожидания и других параметров. Значением по умолчанию является 100.

Фильтр применился к последовательности запроса, заданной как пара, разделенная запятой, состоящая из 'Filter' и одно из следующего:

  • L Области маски низкой композиционной сложности.

  • R Человек маски повторяет элементы (допустимый только для blastn и megablast).

  • M Замаскируйте запрос при создании seed уничтожения, но не во время расширения.

  • 'none' Никакая маска не применяется.

  • L Маскируют любая буква, которая является нижним регистром в запросе.

Можно задать несколько допустимых букв в односимвольном векторе или представить в виде строки, чтобы применить несколько фильтров целиком. Например, 'Lm' применяет и низкий композиционный фильтр сложности и маску.

Выбор отличается в зависимости от выбранного Program. Для получения дополнительной информации см. таблицу Choices for Optional Properties Программой BLAST.

Статистический порог значения для соответствий против последовательностей базы данных, заданных как пара, разделенная запятой, состоящая из 'Expect' и положительного вещественного числа. Значением по умолчанию является 10.

Можно узнать больше о статистике локального сравнения последовательности по https://blast.ncbi.nlm.nih.gov/tutorial/Altschul-1.html#head2.

Размер слова для последовательности запроса, заданной как пара, разделенная запятой, состоящая из 'Word' и положительного целого числа.

Выбор для поиска запроса белка:

  • 2

  • 3 (значение по умолчанию)

Выбор для поиска запроса нуклеотида:

  • 7

  • 11 (значение по умолчанию)

  • 15

Выбор, когда Program установлен в 'megablast':

  • 16

  • 20

  • 24

  • 28 (значение по умолчанию)

  • 32

  • 48

  • 64

  • 128

Матрица замены для последовательностей аминокислот, заданных как пара, разделенная запятой, состоящая из 'Matrix' и вектора символов или строки. Матрица присваивает счет к возможному выравниванию любых двух остатков аминокислоты. Выбор:

  • 'PAM30'

  • 'PAM70'

  • 'BLOSUM45'

  • 'BLOSUM62' (значение по умолчанию)

  • 'BLOSUM80'

Соответствие и несоответствие очкам в выравнивании нуклеотида, заданном как пара, разделенная запятой, состоящая из 'MatchScores' и двухэлементного числового векторного [R Q]. Первый элемент R является счетом соответствия и вторым элементом Q, является счетом несоответствия. Эта опция для blastn и megablast только.

Чтобы гарантировать точную оценку значения выравнивания, только ограниченный набор комбинаций поддерживается. См. таблицу BLAST Optional Properties для всех поддерживаемых значений. Значением по умолчанию для megablast является [1 -2], и значением по умолчанию для blastn является [1 -3].

Штрафы за открытие и расширение разрыва, заданного как пара, разделенная запятой, состоящая из 'GapCosts' и двухэлементного числового вектора. Вектор содержит два целых числа: первым является штраф за открытие разрыва, и вторым является штраф за расширение разрыва.

Допустимые затраты разрыва для blastp, blastx, tblastn и tblastx отличаются согласно матрице замены белка. Для получения дополнительной информации смотрите GapCosts для blastp, blastx, tblastn, и tblastx.

Допустимые затраты разрыва для blastn и megablast отличаются согласно MatchScores ([R Q]). Для получения дополнительной информации смотрите GapCosts для blastn и мегауничтожения.

Композиционный тип корректировки, чтобы компенсировать составы аминокислоты последовательностей, сравниваемых, заданных как пара, разделенная запятой, состоящая из 'CompositionAdjustment' и одно из следующих значений:

  • 'none' Никакая корректировка не применяется (значение по умолчанию).

  • 'cbs' — Основанный на составе подход статистики используется для корректировок счета.

  • 'ccsm' — Условная композиционная матрица счета используется для корректировок счета.

  • 'ucsm' — Универсальная композиционная матрица счета используется для корректировок счета.

Эта опция для blastp, blastx и tblastn только. Получившиеся масштабированные очки приводят к более точным электронным значениям, чем стандартные, немасштабированные очки. Для получения дополнительной информации смотрите Композиционные корректировки.

Entrez запрашивают синтаксис, чтобы искать подмножество выбранной базы данных, заданной как пара, разделенная запятой, состоящая из 'Entrez' и вектора символов или строки. Используйте эту опцию, чтобы ограничить поисковые запросы на основе типов молекулы, длин последовательности, организмов, и так далее. Для получения дополнительной информации об ограничении поисковых запросов см. https://blast.ncbi.nlm.nih.gov/blastcgihelp.shtml#entrez_query.

Расширенные настройки, заданные как пара, разделенная запятой, состоящая из 'Adv' и вектора символов или строки. Например, чтобы задать значения вознаграждения и штрафа для соответствий нуклеотида и несоответствий, используйте '-r 1 -q -3'. Для получения дополнительной информации см. https://www.ncbi.nlm.nih.gov/blast/Doc/urlapi.html.

Выходные аргументы

свернуть все

Запросите ID для отчета BLAST NCBI, возвращенного как вектор символов.

Запросите время выполнения, возвращенного как целое число. Это - предполагаемое время в минутах, пока поиск не завершается.

Совет

Если вы используете функцию getblast, чтобы получить отчет BLAST, используйте эту временную оценку в качестве опции 'WaitTime'.

Больше о

свернуть все

BLAST дополнительные свойства

Выбор для дополнительных свойств программой BLAST

Когда программа BLAST...Затем выбор для следующих опций...
База данныхФильтрWordМатрицаMatchScores [R Q]GapCosts
'blastn''nr' (значение по умолчанию)
'refseq_rna'
'refseq_genomic' 'est'
'est_human'
'est_mouse'
'est_others'
'gss'
'htgs'
'pat'
'pdb'
'alu'
'dbsts'
'chromosome'
'Lm' (значение по умолчанию)
'R'
'm'
'l'
'none'
7
11 (значение по умолчанию)
15
[1 -3] (значение по умолчанию)
[1 -4]
[1 -2]
[1 -1]
[2 -3]
[4 -5]
Смотрите GapCosts для blastn и мегауничтожения.
'megablast'16
20
24
28 (значение по умолчанию)
32
48
64
128
[1 -3]
[1 -4]
[1 -2] (значение по умолчанию)
[1 -1]
[2 -3]
[4 -5]
'tblastn''L' (значение по умолчанию)
'm'
'l'
'none'
2
3 (значение по умолчанию)
'PAM30'
'PAM70'
'BLOSUM45'
'BLOSUM62' (значение по умолчанию)
'BLOSUM80'
Смотрите GapCosts для blastp, blastx, tblastn, и tblastx.
'tblastx'
'blastp''nr' (значение по умолчанию)
'refseq_protein'
'swissprot'
'pat'
'pdb'
'env_nr'
'L'
'm'
'l'
'none' (значение по умолчанию)
'blastx''L' (значение по умолчанию)
'm'
'l'
'none'

GapCosts для blastp, blastx, tblastn и tblastx

Матрица заменыДопустимые значения 'GapCosts'
'PAM30'[7 2]
[6 2]
[5 2]
[10 1]
[9 1] (значение по умолчанию)
[8 1]
'PAM70'[8 2]
[7 2]
[6 2]
[11 1]
[10 1] (значение по умолчанию)
[9 1]
'BLOSUM80'
'BLOSUM45'[13 3]
[12 3]
[11 3]
[10 3]
[15 2] (значение по умолчанию)
[14 2]
[13 2]
[12 2]
[19 1]
[18 1]
[17 1]
[16 1]
'BLOSUM62'[9 2]
[8 2]
[7 2]
[12 1]
[11 1] (значение по умолчанию)
[10 1]

GapCosts для blastn и megablast

MatchScores [R Q]Допустимые значения 'GapCosts'
[1 -4][5 2] (значение по умолчанию)
[1 2]
[0 2]
[2 1]
[1 1]
[1 -3][5 2] (значение по умолчанию)
[2 2]
[1 2]
[0 2]
[2 1]
[1 1]
[1 -2][5 2] (значение по умолчанию)
[2 2]
[1 2]
[0 2]
[3 1]
[2 1]
[1 1]
[1 -1][5 2] (значение по умолчанию)
[3 2]
[2 2]
[1 2]
[0 2]
[4 1]
[3 1]
[2 1]
[2 -3][5 2] (значение по умолчанию)
[4 4]
[2 4]
[0 4]
[3 3]
[6 2]
[4 2]
[2 2]
[4 -5][5 2] (значение по умолчанию)
[6 5]
[5 5]
[4 5]
[3 5]

Вопросы совместимости

развернуть все

Ошибки, запускающиеся в R2017b

Ошибки, запускающиеся в R2017b

Ошибки, запускающиеся в R2017b

Ошибки, запускающиеся в R2017b

Ошибки, запускающиеся в R2017b

Ошибки, запускающиеся в R2017b

Ошибки, запускающиеся в R2017b

Ссылки

[1] Altschul, S.F., В. Джиш, В. Миллер, Э.В. Майерс и Д.Дж. Липмен (1990). "Основное локальное средство поиска выравнивания". J. Молекулярная масса Biol. 215, 403–410.

[2] Altschul, S.F., Т.Л. Мэдден, А.А. Шеффер, Цз. Чжан, Цз. Чжан, В. Миллер и Д. Дж. Липмен (1997). "Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы". Нуклеиновые кислоты Res. 25, 3389–3402.

Смотрите также

| | | |

Внешние веб-сайты

Представлено до R2006a