Считывание данных из файла отчета NCBI BLAST
считывает данные отчета NCBI BLAST из файла в формате XML, blastdata = blastread(blastreport)blastreport, и возвращает blastdataструктура, содержащая соответствующие данные BLAST.
Выполните BLAST-поиск по последовательности белков и сохраните результаты в XML-файле.
Получите последовательность из банка данных белка и создайте структуру MATLAB.
S = getpdb('1CIV');
Использовать структуру в качестве входных данных для поиска BLAST с порогом значимости 1e-10. Первым выводом является идентификатор запроса, а вторым выводом - предполагаемое время (в минутах) до завершения поиска.
[RID1,ROTE] = blastncbi(S,'blastp','expect',1e-10);
Получение результатов поиска из отчета. Отчет в формате XML можно сохранить в файл для автономного доступа. Используйте ROTE в качестве времени ожидания для получения результатов.
report1 = getblast(RID1,'WaitTime',ROTE,'ToFile','1CIV_report.xml')
Blast results are not available yet. Please wait ...
report1 =
struct with fields:
RID: 'R49TJMCF014'
Algorithm: 'BLASTP 2.6.1+'
Database: 'nr'
QueryID: 'Query_224139'
QueryDefinition: 'unnamed protein product'
Hits: [1×100 struct]
Parameters: [1×1 struct]
Statistics: [1×1 struct]
Использовать blastread для считывания данных BLAST из файла отчета BLAST в формате XML.
blastdata = blastread('1CIV_report.xml')
blastdata =
struct with fields:
RID: ''
Algorithm: 'BLASTP 2.6.1+'
Database: 'nr'
QueryID: 'Query_224139'
QueryDefinition: 'unnamed protein product'
Hits: [1×100 struct]
Parameters: [1×1 struct]
Statistics: [1×1 struct]
В качестве альтернативы выполните поиск BLAST с номером доступа NCBI.
RID2 = blastncbi('AAA59174','blastp','expect',1e-10)
RID2 =
'R49WAPMH014'
Получение результатов поиска из отчета.
report2 = getblast(RID2)
Blast results are not available yet. Please wait ...
report2 =
struct with fields:
RID: 'R49WAPMH014'
Algorithm: 'BLASTP 2.6.1+'
Database: 'nr'
QueryID: 'AAA59174.1'
QueryDefinition: 'insulin receptor precursor [Homo sapiens]'
Hits: [1×100 struct]
Parameters: [1×1 struct]
Statistics: [1×1 struct]
blastreport - Наименование файла отчета BLASTИмя файла отчета BLAST в формате XML, указанного как символьный вектор или строка.
Пример: 'blastreport.xml'
blastdata - Данные отчета BLASTДанные отчета BLAST, возвращенные в виде структуры, содержащей следующие поля:
| Область | Описание |
|---|---|
RID | Идентификатор запроса для получения результатов из определенного поиска NCBI BLAST |
Algorithm | Алгоритм NCBI, используемый для поиска BLAST |
Database | Поиск во всех базах данных |
QueryID | Идентификатор последовательности запросов |
QueryDefinition | Определение последовательности запросов |
Hits | Структура, содержащая информацию о последовательностях совпадений, таких как идентификаторы, номера присоединения, длины и HSP (пары сегментов с высокой оценкой) |
Parameters | Структура, содержащая информацию о входных параметрах, используемых для выполнения поиска |
Statistics | Сводка статистических данных о выполненном поиске, таких как значения лямбда, каппа и энтропия |
В этой таблице перечислены все поля blastdata.Hits.
| Область | Описание |
|---|---|
ID | Идентификатор последовательности субъектов, соответствующей последовательности запросов |
Definition | Описание последовательности темы |
Accession | Присоединение последовательности предметов |
Length | Длина последовательности предметов |
Hsps | Структура, содержащая информацию о парах сегментов с высокой оценкой (HSP) |
Эта таблица суммирует поля Hits.Hsps.
| Область | Описание |
|---|---|
Score | Парный балл выравнивания для пары сегментов с высокой оценкой между последовательностью запросов и последовательностью субъектов. |
BitScore | Битовый балл для пары сегментов с высоким баллом. |
Expect | Ожидаемое значение для пары сегментов с высокой оценкой. |
Identities | Количество идентичных или аналогичных остатков для пары сегментов с высокой оценкой между последовательностью запросов и последовательностью субъектов. |
Positives | Количество идентичных или подобных остатков для пары последовательностей с высокой оценкой между последовательностью запроса и аминокислотной последовательностью субъекта. Это поле применимо только к транслированным нуклеотидным или аминокислотным последовательностям запросов и базам данных. |
Gaps | Неориентированные остатки для пары сегментов с высокой оценкой. |
AlignmentLength | Длина трассы для пары сегментов с высокой оценкой. |
QueryIndices | Индексы позиций остатков последовательности запросов для пары сегментов с высокой оценкой. |
SubjectIndices | Индексы позиций остатков последовательности субъектов для пары сегментов с высокой оценкой. |
Frame | Рамка считывания транслированной нуклеотидной последовательности для пары сегментов с высокой оценкой. |
Alignment | 3-by-N символьный массив, показывающий выравнивание для пары последовательностей с высокой оценкой между последовательностью запросов и последовательностью субъектов. Первая строка является последовательностью запросов, вторая строка - выравниванием, а третья строка - последовательностью субъектов. |
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.