blastread

Считайте данные из файла отчета NCBI BLAST

Описание

пример

blastdata = blastread(blastreport) считывает данные отчета NCBI BLAST из XML-форматированного файла, blastreport, и возвращает blastdata, структуру, содержащую соответствующие данные BLAST.

Примеры

свернуть все

Выполните поиск BLAST по последовательности белков и сохраните результаты в XML- файл.

Получите последовательность из Protein Data Bank и создайте структуру MATLAB.

S = getpdb('1CIV');

Используйте структуру как вход для поиска BLAST с порогом значимости 1e-10. Первый выход - это идентификатор запроса, а второй выход - это предполагаемое время (в минутах) до завершения поиска.

[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);

Получите результаты поиска из отчета. Можно сохранить отчет в формате XML в файл для автономного доступа. Используйте ROTE в качестве времени ожидания для получения результатов.

report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...

report1 = 

  struct with fields:

                RID: 'R49TJMCF014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Использование blastread для чтения данных BLAST из файла отчета BLAST в формате XML.

blastdata = blastread('1CIV_report.xml')
blastdata = 

  struct with fields:

                RID: ''
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Также выполните поиск BLAST с номером присоединения NCBI.

RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =

    'R49WAPMH014'

Получите результаты поиска из отчета.

report2 = getblast(RID2)
Blast results are not available yet. Please wait ...

report2 = 

  struct with fields:

                RID: 'R49WAPMH014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'AAA59174.1'
    QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Входные параметры

свернуть все

Имя файла отчета BLAST в формате XML, заданное в виде вектора символов или строки.

Пример: 'blastreport.xml'

Выходные аргументы

свернуть все

Данные отчета BLAST, возвращенные как структура, содержащая следующие поля:

ОбластьОписание
RIDИдентификатор запроса для извлечения результатов из определенного поиска NCBI BLAST
AlgorithmАлгоритм NCBI, используемый для выполнения поиска BLAST
DatabaseПоиск по всем базам данных
QueryIDИдентификатор последовательности запросов
QueryDefinitionОпределение последовательности запросов
HitsСтруктура, содержащая информацию о последовательностях ударов, таких как идентификаторы, номера присоединения, длины и HSP (пары сегментов с высоким баллом)
ParametersСтруктура, содержащая информацию о входных параметрах, используемых для выполнения поиска
StatisticsСводные данные статистических подробностей о выполненном поиске, таких как значения лямбды, каппы и энтропии

Подробнее о

свернуть все

Хиты

В этой таблице перечислены все поля blastdata.Hits.

ОбластьОписание
IDИдентификатор последовательности субъектов, которая совпадала с последовательностью запросов
DefinitionОписание тематической последовательности
AccessionПрисоединение к предметной последовательности
LengthДлина тематической последовательности
HspsСтруктура, содержащая информацию о парах высокоточных сегментов (HSP)

Хиты. Hsps

В этой таблице представлены поля Hits.Hsps.

ОбластьОписание
ScoreПарный счет выравнивания для пары сегментов с высоким баллом между последовательностью запросов и последовательностью субъектов.
BitScoreБитовый счет для пары сегмента с высоким баллом.
ExpectЗначение ожидания для пары сегментов с высоким баллом.
IdentitiesКоличество одинаковых или аналогичных остатков для пары сегментов с высоким скорингом между последовательностью запросов и последовательностью субъектов.
PositivesКоличество одинаковых или аналогичных остатков для пары высокоточной последовательности между последовательностью запроса и последовательностью субъекта аминокислоты. Это поле относится только к переведенным нуклеотидным или аминокислотным запрашивающим последовательностям и базам данных.
GapsНевыровненные остатки для пары сегментов с высоким скорингом.
AlignmentLengthДлина выравнивания для пары сегментов с высоким баллом.
QueryIndicesИндексы позиций остатков последовательности запросов для пары сегментов с высоким баллом.
SubjectIndicesИндексы позиций остатков исследуемой последовательности для пары сегментов с высоким скорингом.
FrameСистема координат считывания переведенной нуклеотидной последовательности для пары сегментов с высоким скорингом.
Alignment3-by N символьный массив, показывающий выравнивание для пары высокоточной последовательности между последовательностью запросов и тематической последовательностью. Первая строка является последовательностью запросов, вторая строка - выравниванием, а третья строка - последовательностью субъектов.

См. также

|

Представлено до R2006a