Считайте данные из локального отчета BLAST
Data = blastreadlocal(BLASTReport, Format)
BLASTReport | Отчет BLAST, заданный любым следующим:
Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в текущей папке. |
Format | Целое число, задающее формат выравнивания раньше, создавало
|
Data | Структура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST. |
Основное локальное средство поиска выравнивания (BLAST) предлагает быстрый и мощный сравнительный анализ белка и последовательностей нуклеотида против известных последовательностей в онлайновых и локальных базах данных. Отчеты BLAST могут быть длинными, и парсинг данных из различных форматов может быть громоздким.
чтения Data = blastreadlocal(BLASTReport, Format)BLASTReport, локально созданный файл отчета BLAST, и возвращает Data, структура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST. Format целое число, указывающее, что формат выравнивания раньше создавал BLASTReport.
Функция принимает, что отчет BLAST был представлен с помощью версии 2.2.17 blastall исполняемый файл.
Data содержит подмножество следующих полей, на основе заданного формата выравнивания.
| Поле | Описание |
|---|---|
Algorithm | Алгоритм NCBI раньше делал поиск BLAST. |
Query | Идентификатор последовательности запроса подвергается поиску BLAST. |
Length | Длина последовательности запроса. |
Database | Все базы данных ищутся. |
Hits.Name | Имя последовательности базы данных (подвергают последовательность), который совпадал с последовательностью запроса. |
Hits.Score | Счет выравнивания между последовательностью запроса и подчиненной последовательностью. |
Hits.Expect | Значение ожидания для выравнивания между последовательностью запроса и подчиненной последовательностью. |
Hits.Length | Длина подчиненной последовательности. |
Hits.HSPs.Score | Попарный счет выравнивания к высоко выигрывающей паре последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Expect | Значение ожидания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Identities | Тождества (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Positives | Идентичные или подобные остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот. ПримечаниеЭто поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и/или базам данных.
|
Hits.HSPs.Gaps | Неприсоединившиеся остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Mismatches | Остатки, которые не похожи друг на друга (соответствие, возможны, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.Frame | Рамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. ПримечаниеЭто поле применяется только, когда выполнение перевело поисковые запросы, то есть, при использовании
|
Hits.HSPs.Strand | Смысл ( ПримечаниеЭто поле применяется только при использовании последовательности запроса нуклеотида и базы данных.
|
Hits.HSPs.Alignment | Матрица с тремя строками, показывающая выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.QueryIndices | Индексы положений остатка последовательности запроса для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.SubjectIndices | Индексы подчиненных положений остатка последовательности для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Hits.HSPs.AlignmentLength | Продолжительность попарного выравнивания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью. |
Alignment | Целое выравнивание для последовательности запроса и подчиненной последовательности (последовательностей). |
Statistics | Сводные данные статистических деталей о выполняемом поиске, таких как значения lambda, разрывают штрафы, количество последовательностей, искавших и количество хитов. |
Следующие примеры принимают, что у вас есть файл нуклеотида FASTA для E. coli, такого как файл NC_004431.fna.
Создайте локальную blastable базу данных из NC_004431.fna Файл FASTA.
blastformat('inputdb', 'NC_004431.fna', 'protein', 'false');Используйте getgenbank функция, чтобы получить две последовательности из базы данных GenBank®.
S1 = getgenbank('M28570.1');
S2 = getgenbank('M12565');Создайте файл запроса при помощи fastawrite функция, чтобы создать файл с именем FASTA query_multi_nt.fa от этих двух последовательностей, с помощью единственного инвентарного номера в качестве заголовка.
Seqs(1).Header = S1.Accession;
Seqs(1).Sequence = S1.Sequence;
Seqs(2).Header = S2.Accession;
Seqs(2).Sequence = S2.Sequence;
fastawrite('query_multi_nt.fa', Seqs);Представьте последовательности запроса в query_multi_nt.fa Файл FASTA для поиска BLAST локальной базы данных NC_004431.fna нуклеотида. Задайте программу BLAST blastn и табличный формат выравнивания. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt8.txt, и затем считайте локальный отчет BLAST.
blastlocal('inputquery', 'query_multi_nt.fa',...
'database', 'NC_004431.fna',...
'tofile', 'myecoli_nt8.txt', 'program', 'blastn',...
'format', 8);
blastreadlocal('myecoli_nt8.txt', 8);
Если вы уже не сделали так, создайте локальную blastable базу данных и файл запроса, аналогичный описанному ранее.
Представьте последовательности запроса в query_multi_nt.fa Файл FASTA для поиска BLAST локальной базы данных NC_004431.fna нуклеотида. Задайте программу BLAST blastn и привязанный запросом формат. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt1.txt, и затем считайте локальный отчет BLAST, сохранив результаты в results, массив структур.
blastlocal('inputquery', 'query_multi_nt.fa',...
'database', 'NC_004431.fna',...
'tofile', 'myecoli_nt1.txt', 'program', 'blastn',...
'format', 1);
results = blastreadlocal('myecoli_nt1.txt', 1);
[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.
[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.
Для получения дополнительной информации о чтении и интерпретации отчетов BLAST, см.:
blastformat | blastlocal | blastncbi | blastread | getblast