exponenta event banner

getblast

Получение отчета BLAST с веб-сайта NCBI

Описание

пример

blastdata = getblast(RID) восстанавливает RID, идентификатор запроса для отчета NCBI BLAST и возвращает данные отчета в blastdata, структура MATLAB ®. Идентификатор запроса ,RID, должно быть последним, поскольку NCBI очищает отчеты через 36 часов.

blastdata = getblast(RID,Name,Value) использует дополнительные параметры, заданные одним или несколькими аргументами пары имя-значение.

Примеры

свернуть все

Выполните BLAST-поиск по последовательности белков и сохраните результаты в XML-файле.

Получите последовательность из банка данных белка и создайте структуру MATLAB.

S = getpdb('1CIV');

Использовать структуру в качестве входных данных для поиска BLAST с порогом значимости 1e-10. Первым выводом является идентификатор запроса, а вторым выводом - предполагаемое время (в минутах) до завершения поиска.

[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);

Получение результатов поиска из отчета. Отчет в формате XML можно сохранить в файл для автономного доступа. Используйте ROTE в качестве времени ожидания для получения результатов.

report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...

report1 = 

  struct with fields:

                RID: 'R49TJMCF014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Использовать blastread для считывания данных BLAST из файла отчета BLAST в формате XML.

blastdata = blastread('1CIV_report.xml')
blastdata = 

  struct with fields:

                RID: ''
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

В качестве альтернативы выполните поиск BLAST с регистрационным номером NCBI.

RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =

    'R49WAPMH014'

Получение результатов поиска из отчета.

report2 = getblast(RID2)
Blast results are not available yet. Please wait ...

report2 = 

  struct with fields:

                RID: 'R49WAPMH014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'AAA59174.1'
    QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Входные аргументы

свернуть все

Идентификатор запроса для извлечения результатов из определенного поиска NCBI BLAST, заданного как символьный вектор или строка.

Пример: 'GTF033EZ015'

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'ToFile','report.xml' сохраняет результаты в файл с именем report.xml.

Имя файла для сохранения данных отчета, указанного как разделенная запятыми пара, состоящая из 'ToFile' и символьный вектор или строку. По умолчанию файл имеет формат XML.

Пример: 'ToFile','Report.xml'

Время (в минутах) ожидания готовности отчета от NCBI, указанное как пара, разделенная запятыми, состоящая из 'WaitTime' и неотрицательное целое число. Если отчет все еще не готов по истечении указанного времени, генерируется ошибка.

Значение по умолчанию - 0, т.е. задержка при получении отчета отсутствует.

Совет

Используйте RTOE, время выполнения запроса, возвращенное blastncbi в качестве времени ожидания здесь.

Пример: 'WaitTime',2

Тайм-аут соединения (в секундах) для каждого запроса, указанный как положительный скаляр. Подробнее см. здесь.

Пример: 'TimeOut',10

Выходные аргументы

свернуть все

Данные отчета BLAST, возвращенные в виде структуры, содержащей следующие поля:

ОбластьОписание
RIDИдентификатор запроса для получения результатов из определенного поиска NCBI BLAST
AlgorithmАлгоритм NCBI, используемый для поиска BLAST
DatabaseПоиск во всех базах данных
QueryIDИдентификатор последовательности запросов
QueryDefinitionОпределение последовательности запросов
HitsСтруктура, содержащая информацию о последовательностях совпадений, таких как идентификаторы, номера присоединения, длины и HSP (пары сегментов с высокой оценкой)
ParametersСтруктура, содержащая информацию о входных параметрах, используемых для выполнения поиска
StatisticsСводка статистических данных о выполненном поиске, таких как значения лямбда, каппа и энтропия

Подробнее

свернуть все

Хиты

В этой таблице перечислены все поля blastdata.Hits.

ОбластьОписание
IDИдентификатор последовательности субъектов, соответствующей последовательности запросов
DefinitionОписание последовательности темы
AccessionПрисоединение последовательности предметов
LengthДлина последовательности предметов
HspsСтруктура, содержащая информацию о парах сегментов с высокой оценкой (HSP)

Хиты. Hsps

Эта таблица суммирует поля Hits.Hsps.

ОбластьОписание
ScoreПарный балл выравнивания для пары сегментов с высокой оценкой между последовательностью запросов и последовательностью субъектов.
BitScoreБитовый балл для пары сегментов с высоким баллом.
ExpectОжидаемое значение для пары сегментов с высокой оценкой.
IdentitiesКоличество идентичных или аналогичных остатков для пары сегментов с высокой оценкой между последовательностью запросов и последовательностью субъектов.
PositivesКоличество идентичных или подобных остатков для пары последовательностей с высокой оценкой между последовательностью запроса и аминокислотной последовательностью субъекта. Это поле применимо только к транслированным нуклеотидным или аминокислотным последовательностям запросов и базам данных.
GapsНеориентированные остатки для пары сегментов с высокой оценкой.
AlignmentLengthДлина трассы для пары сегментов с высокой оценкой.
QueryIndicesИндексы позиций остатков последовательности запросов для пары сегментов с высокой оценкой.
SubjectIndicesИндексы позиций остатков последовательности субъектов для пары сегментов с высокой оценкой.
FrameРамка считывания транслированной нуклеотидной последовательности для пары сегментов с высокой оценкой.
Alignment3-by-N символьный массив, показывающий выравнивание для пары последовательностей с высокой оценкой между последовательностью запросов и последовательностью субъектов. Первая строка является последовательностью запросов, вторая строка - выравниванием, а третья строка - последовательностью субъектов.

Вопросы совместимости

развернуть все

Ошибки, начинающиеся с R2017b

Ошибки, начинающиеся с R2017b

Ошибки, начинающиеся с R2017b

См. также

|

Представлен до R2006a