blastread

Считайте данные из файла отчета BLAST NCBI

Описание

пример

blastdata = blastread(blastreport) считывает данные об отчете BLAST NCBI из XML-отформатированного файла, blastreport, и возвращает blastdata, структура, содержащая соответствующий Показатель взрываемости.

Примеры

свернуть все

Выполните поиск BLAST на последовательности белка и сохраните результаты в XML-файл.

Получите последовательность от Банка данных Белка и создайте структуру MATLAB.

S = getpdb('1CIV');

Используйте структуру в качестве входа для поиска BLAST с порогом значения 1e-10. Первый выход является ID запроса, и второй выход является предполагаемым временем (в минутах), пока поиск не завершается.

[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);

Получите результаты поиска из отчета. Можно сохранить XML-отформатированный отчет в файл для оффлайнового доступа. Используйте ROTE в качестве времени ожидания, чтобы получить результаты.

report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...

report1 = 

  struct with fields:

                RID: 'R49TJMCF014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Используйте blastread чтобы считать Показатель взрываемости из XML-отформатированного BLAST сообщают о файле.

blastdata = blastread('1CIV_report.xml')
blastdata = 

  struct with fields:

                RID: ''
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

В качестве альтернативы запустите поиск BLAST с инвентарным номером NCBI.

RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =

    'R49WAPMH014'

Получите результаты поиска из отчета.

report2 = getblast(RID2)
Blast results are not available yet. Please wait ...

report2 = 

  struct with fields:

                RID: 'R49WAPMH014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'AAA59174.1'
    QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Входные параметры

свернуть все

Имя XML-отформатированного BLAST сообщает о файле в виде вектора символов или строки.

Пример: 'blastreport.xml'

Выходные аргументы

свернуть все

Данные об отчете BLAST, возвращенные как структура, которая содержит следующие поля:

Поле Описание
RIDЗапросите ID для получения результатов определенного поиска BLAST NCBI
AlgorithmАлгоритм NCBI раньше выполнял поиск BLAST
DatabaseВсе базы данных ищутся
QueryIDИдентификатор последовательности запроса
QueryDefinitionОпределение последовательности запроса
HitsСтруктура, содержащая информацию о последовательностях хита, таких как идентификаторы, инвентарные номера, длины и HSPs (высоко выигрывающие пары сегмента)
ParametersСтруктура, содержащая информацию о входных параметрах раньше, выполняла поиск
StatisticsСводные данные статистических деталей о выполняемом поиске, таких как lambda, каппа и энтропийные значения

Больше о

свернуть все

Хиты

Эта таблица приводит каждое поле blastdata.Hits.

Поле Описание
IDID подчиненной последовательности, которая совпадала с последовательностью запроса
DefinitionОписание подчиненной последовательности
AccessionДоступ подчиненной последовательности
LengthДлина подчиненной последовательности
HspsСтруктура, содержащая информацию о высоко выигрывающих парах сегмента (HSPs)

Hits.Hsps

Эта таблица суммирует поля Hits.Hsps.

Поле Описание
ScoreПопарный счет выравнивания к высоко выигрывающей паре сегмента между последовательностью запроса и подчиненной последовательностью.
BitScoreБитный счет к высоко выигрывающей паре сегмента.
ExpectЗначение ожидания для высоко выигрывающей пары сегмента.
IdentitiesКоличество идентичных или подобных остатков для высоко выигрывающей пары сегмента между последовательностью запроса и подчиненной последовательностью.
PositivesКоличество идентичных или подобных остатков для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот. Это поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и базам данных.
GapsНеприсоединившиеся остатки для высоко выигрывающей пары сегмента.
AlignmentLengthПродолжительность выравнивания для высоко выигрывающей пары сегмента.
QueryIndicesИндексы положений остатка последовательности запроса для высоко выигрывающей пары сегмента.
SubjectIndicesИндексы подчиненных положений остатка последовательности для высоко выигрывающей пары сегмента.
FrameРамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары сегмента.
Alignment3 N символьным массивом, показывающим выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. Первая строка является последовательностью запроса, вторая строка является выравниванием, и третья строка является подчиненной последовательностью.

Смотрите также

|

Представлено до R2006a