exponenta event banner

blastread

Считывание данных из файла отчета NCBI BLAST

Описание

пример

blastdata = blastread(blastreport) считывает данные отчета NCBI BLAST из файла в формате XML, blastreport, и возвращает blastdataструктура, содержащая соответствующие данные BLAST.

Примеры

свернуть все

Выполните BLAST-поиск по последовательности белков и сохраните результаты в XML-файле.

Получите последовательность из банка данных белка и создайте структуру MATLAB.

S = getpdb('1CIV');

Использовать структуру в качестве входных данных для поиска BLAST с порогом значимости 1e-10. Первым выводом является идентификатор запроса, а вторым выводом - предполагаемое время (в минутах) до завершения поиска.

[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);

Получение результатов поиска из отчета. Отчет в формате XML можно сохранить в файл для автономного доступа. Используйте ROTE в качестве времени ожидания для получения результатов.

report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...

report1 = 

  struct with fields:

                RID: 'R49TJMCF014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Использовать blastread для считывания данных BLAST из файла отчета BLAST в формате XML.

blastdata = blastread('1CIV_report.xml')
blastdata = 

  struct with fields:

                RID: ''
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'Query_224139'
    QueryDefinition: 'unnamed protein product'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

В качестве альтернативы выполните поиск BLAST с номером доступа NCBI.

RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =

    'R49WAPMH014'

Получение результатов поиска из отчета.

report2 = getblast(RID2)
Blast results are not available yet. Please wait ...

report2 = 

  struct with fields:

                RID: 'R49WAPMH014'
          Algorithm: 'BLASTP 2.6.1+'
           Database: 'nr'
            QueryID: 'AAA59174.1'
    QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
               Hits: [1×100 struct]
         Parameters: [1×1 struct]
         Statistics: [1×1 struct]

Входные аргументы

свернуть все

Имя файла отчета BLAST в формате XML, указанного как символьный вектор или строка.

Пример: 'blastreport.xml'

Выходные аргументы

свернуть все

Данные отчета BLAST, возвращенные в виде структуры, содержащей следующие поля:

ОбластьОписание
RIDИдентификатор запроса для получения результатов из определенного поиска NCBI BLAST
AlgorithmАлгоритм NCBI, используемый для поиска BLAST
DatabaseПоиск во всех базах данных
QueryIDИдентификатор последовательности запросов
QueryDefinitionОпределение последовательности запросов
HitsСтруктура, содержащая информацию о последовательностях совпадений, таких как идентификаторы, номера присоединения, длины и HSP (пары сегментов с высокой оценкой)
ParametersСтруктура, содержащая информацию о входных параметрах, используемых для выполнения поиска
StatisticsСводка статистических данных о выполненном поиске, таких как значения лямбда, каппа и энтропия

Подробнее

свернуть все

Хиты

В этой таблице перечислены все поля blastdata.Hits.

ОбластьОписание
IDИдентификатор последовательности субъектов, соответствующей последовательности запросов
DefinitionОписание последовательности темы
AccessionПрисоединение последовательности предметов
LengthДлина последовательности предметов
HspsСтруктура, содержащая информацию о парах сегментов с высокой оценкой (HSP)

Хиты. Hsps

Эта таблица суммирует поля Hits.Hsps.

ОбластьОписание
ScoreПарный балл выравнивания для пары сегментов с высокой оценкой между последовательностью запросов и последовательностью субъектов.
BitScoreБитовый балл для пары сегментов с высоким баллом.
ExpectОжидаемое значение для пары сегментов с высокой оценкой.
IdentitiesКоличество идентичных или аналогичных остатков для пары сегментов с высокой оценкой между последовательностью запросов и последовательностью субъектов.
PositivesКоличество идентичных или подобных остатков для пары последовательностей с высокой оценкой между последовательностью запроса и аминокислотной последовательностью субъекта. Это поле применимо только к транслированным нуклеотидным или аминокислотным последовательностям запросов и базам данных.
GapsНеориентированные остатки для пары сегментов с высокой оценкой.
AlignmentLengthДлина трассы для пары сегментов с высокой оценкой.
QueryIndicesИндексы позиций остатков последовательности запросов для пары сегментов с высокой оценкой.
SubjectIndicesИндексы позиций остатков последовательности субъектов для пары сегментов с высокой оценкой.
FrameРамка считывания транслированной нуклеотидной последовательности для пары сегментов с высокой оценкой.
Alignment3-by-N символьный массив, показывающий выравнивание для пары последовательностей с высокой оценкой между последовательностью запросов и последовательностью субъектов. Первая строка является последовательностью запросов, вторая строка - выравниванием, а третья строка - последовательностью субъектов.

См. также

|

Представлен до R2006a