Считайте данные из локального отчета BLAST
Data
= blastreadlocal(BLASTReport
, Format
)
BLASTReport | Отчет BLAST, заданный любым следующим:
Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в текущей папке. |
Format | Целое число, задающее формат выравнивания раньше, создавало
|
Data | Структура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST. |
Основное локальное средство поиска выравнивания (BLAST) предлагает быстрый и мощный сравнительный анализ белка и последовательностей нуклеотида против известных последовательностей в онлайновых и локальных базах данных. Отчеты BLAST могут быть длинными, и парсинг данных из различных форматов может быть громоздким.
чтения Data
= blastreadlocal(BLASTReport
, Format
)BLASTReport
, локально созданный файл отчета BLAST, и возвращает Data
, структура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST. Format
целое число, указывающее, что формат выравнивания раньше создавал BLASTReport
.
Функция принимает, что отчет BLAST был представлен с помощью версии 2.2.17 blastall
исполняемый файл.
Data
содержит подмножество следующих полей, на основе заданного формата выравнивания.
Поле | Описание |
---|---|
Algorithm | Алгоритм NCBI раньше делал поиск BLAST. |
Query | Идентификатор последовательности запроса подвергается поиску BLAST. |
Length | Длина последовательности запроса. |
Database | Все базы данных ищутся. |
Hits.Name | Имя последовательности базы данных (подвергают последовательность), который совпадал с последовательностью запроса. |
Hits.Score | Счет выравнивания между последовательностью запроса и подчиненной последовательностью. |
Hits.Expect | Значение ожидания для выравнивания между последовательностью запроса и подчиненной последовательностью. |
Hits.Length | Длина подчиненной последовательности. |
Hits.HSPs.Score | Попарный счет выравнивания к высоко выигрывающей паре последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Expect | Значение ожидания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Identities | Тождества (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Positives | Идентичные или подобные остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот. ПримечаниеЭто поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и/или базам данных.
|
Hits.HSPs.Gaps | Неприсоединившиеся остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Mismatches | Остатки, которые не похожи друг на друга (соответствие, возможны, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Frame | Рамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. ПримечаниеЭто поле применяется только, когда выполнение перевело поисковые запросы, то есть, при использовании
|
Hits.HSPs.Strand | Смысл ( ПримечаниеЭто поле применяется только при использовании последовательности запроса нуклеотида и базы данных.
|
Hits.HSPs.Alignment | Матрица с тремя строками, показывающая выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.QueryIndices | Индексы положений остатка последовательности запроса для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.SubjectIndices | Индексы подчиненных положений остатка последовательности для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.AlignmentLength | Продолжительность попарного выравнивания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Alignment | Целое выравнивание для последовательности запроса и подчиненной последовательности (последовательностей). |
Statistics | Сводные данные статистических деталей о выполняемом поиске, таких как значения lambda, разрывают штрафы, количество последовательностей, искавших и количество хитов. |
Следующие примеры принимают, что у вас есть файл нуклеотида FASTA для E. coli, такого как файл NC_004431.fna
.
Создайте локальную blastable базу данных из NC_004431.fna
Файл FASTA.
blastformat('inputdb', 'NC_004431.fna', 'protein', 'false');
Используйте getgenbank
функция, чтобы получить две последовательности из базы данных GenBank®.
S1 = getgenbank('M28570.1'); S2 = getgenbank('M12565');
Создайте файл запроса при помощи fastawrite
функция, чтобы создать файл с именем FASTA query_multi_nt.fa
от этих двух последовательностей, с помощью единственного инвентарного номера в качестве заголовка.
Seqs(1).Header = S1.Accession; Seqs(1).Sequence = S1.Sequence; Seqs(2).Header = S2.Accession; Seqs(2).Sequence = S2.Sequence; fastawrite('query_multi_nt.fa', Seqs);
Представьте последовательности запроса в query_multi_nt.fa
Файл FASTA для поиска BLAST локальной базы данных NC_004431.fna
нуклеотида. Задайте программу BLAST
blastn
и табличный формат выравнивания. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt8.txt
, и затем считайте локальный отчет BLAST.
blastlocal('inputquery', 'query_multi_nt.fa',... 'database', 'NC_004431.fna',... 'tofile', 'myecoli_nt8.txt', 'program', 'blastn',... 'format', 8); blastreadlocal('myecoli_nt8.txt', 8);
Если вы уже не сделали так, создайте локальную blastable базу данных и файл запроса, аналогичный описанному ранее.
Представьте последовательности запроса в query_multi_nt.fa
Файл FASTA для поиска BLAST локальной базы данных NC_004431.fna
нуклеотида. Задайте программу BLAST
blastn
и привязанный запросом формат. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt1.txt
, и затем считайте локальный отчет BLAST, сохранив результаты в results
, массив структур.
blastlocal('inputquery', 'query_multi_nt.fa',... 'database', 'NC_004431.fna',... 'tofile', 'myecoli_nt1.txt', 'program', 'blastn',... 'format', 1); results = blastreadlocal('myecoli_nt1.txt', 1);
[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.
[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.
Для получения дополнительной информации о чтении и интерпретации отчетов BLAST, см.:
blastformat
| blastlocal
| blastncbi
| blastread
| getblast