blastread

Считайте данные из файла отчета BLAST NCBI

Синтаксис

blastdata = blastread(blastreport)

Описание

пример

blastdata = blastread(blastreport) считывает данные об отчете BLAST NCBI из XML-отформатированного файла, blastreport, и возвращает blastdata, структура, содержащая соответствующий Показатель взрываемости.

Примеры

свернуть все

Выполните поиск BLAST на последовательности белка и сохраните результаты в XML-файл.

Получите последовательность от Банка данных Белка и создайте структуру MATLAB.

S = getpdb('1CIV');

Используйте структуру в качестве входа для поиска BLAST с порогом значения 1e-10. Первый вывод является ID запроса, и второй вывод является предполагаемым временем (в минутах), пока поиск не завершается.

[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);

Получите результаты поиска из отчета. Можно сохранить XML-отформатированный отчет в файл для оффлайнового доступа. Используйте ROTE в качестве времени ожидания, чтобы получить результаты.

report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...

report1 = 

  struct with fields:

                RID: 'R49TJMCF014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Используйте blastread, чтобы считать Показатель взрываемости из XML-отформатированного файла отчета BLAST.

blastdata = blastread('1CIV_report.xml')
blastdata = 

  struct with fields:

                RID: ''
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Также запустите поиск BLAST с инвентарным номером NCBI.

RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =

    'R49WAPMH014'

Получите результаты поиска из отчета.

report2 = getblast(RID2)
Blast results are not available yet. Please wait ...

report2 = 

  struct with fields:

                RID: 'R49WAPMH014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'AAA59174.1'
    QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Входные параметры

свернуть все

Имя XML-отформатированного BLAST сообщает о файле, заданном как вектор символов или строка.

Пример: 'blastreport.xml'

Выходные аргументы

свернуть все

Данные об отчете BLAST, возвращенные как структура, которая содержит следующие поля:

Поле Описание
RIDЗапросите ID для получения результатов определенного поиска BLAST NCBI
AlgorithmАлгоритм NCBI раньше выполнял поиск BLAST
DatabaseВсе базы данных ищутся
QueryIDИдентификатор последовательности запроса
QueryDefinitionОпределение последовательности запроса
HitsСтруктура, содержащая информацию о последовательностях хита, таких как идентификаторы, инвентарные номера, длины и HSPs (высоко выигрывающие пары сегмента)
ParametersСтруктура, содержащая информацию о входных параметрах раньше, выполняла поиск
StatisticsСводные данные статистических деталей о выполняемом поиске, таких как lambda, каппа и энтропийные значения

Больше о

свернуть все

Хиты

Эта таблица приводит каждое поле blastdata.Hits.

Поле Описание
IDID подчиненной последовательности, которая совпадала с последовательностью запроса
DefinitionОписание подчиненной последовательности
AccessionДоступ подчиненной последовательности
LengthДлина подчиненной последовательности
HspsСтруктура, содержащая информацию о высоко выигрывающих парах сегмента (HSPs)

Хиты. Hsps

Эта таблица суммирует поля Hits.Hsps.

Поле Описание
ScoreПопарный счет выравнивания к высоко выигрывающей паре сегмента между последовательностью запроса и подчиненной последовательностью.
BitScoreБитный счет к высоко выигрывающей паре сегмента.
ExpectЗначение ожидания для высоко выигрывающей пары сегмента.
IdentitiesКоличество идентичных или подобных остатков для высоко выигрывающей пары сегмента между последовательностью запроса и подчиненной последовательностью.
PositivesКоличество идентичных или подобных остатков для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот. Это поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и базам данных.
GapsНеприсоединившиеся остатки для высоко выигрывающей пары сегмента.
AlignmentLengthПродолжительность выравнивания для высоко выигрывающей пары сегмента.
QueryIndicesИндексы положений остатка последовательности запроса для высоко выигрывающей пары сегмента.
SubjectIndicesИндексы подчиненных положений остатка последовательности для высоко выигрывающей пары сегмента.
FrameРамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары сегмента.
Alignment3 N символьным массивом, показывающим выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. Первая строка является последовательностью запроса, вторая строка является выравниванием, и третья строка является подчиненной последовательностью.

Смотрите также

| | | |

Представлено до R2006a