blastreadlocal

Считайте данные из локального отчета BLAST

Синтаксис

Data = blastreadlocal(BLASTReport, Format)

Входные параметры

BLASTReport

Отчет BLAST, заданный любым следующим:

  • Имя файла или путь и имя файла локально созданного BLAST сообщают о файле, такой, как возвращено функцией blastlocal со свойством 'ToFile'.

  • Одномерный символьный массив или строка, которая содержит текст для локального отчета BLAST.

Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в текущей папке.

Format

Целое число, задающее формат выравнивания раньше, создавало BLASTReport. Выбор:

  • 0 — Попарно

  • 1 — Привязанные запросом, показывающие тождества

  • 2 — Привязанный запросом, никакие тождества

  • 3 — Плоские привязанные запросом, показывающие тождества

  • 4 — Плоский привязанный запросом, никакие тождества

  • 5 — Привязанный запросом, никакие тождества и тупые концы

  • 6 — Плоский привязанный запросом, никакие тождества и тупые концы

  • 7 — Не используемый

  • 8 — Табличный

  • 9 — Табличный со строками с комментариями

Выходные аргументы

DataСтруктура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST.

Описание

Основное локальное средство поиска выравнивания (BLAST) предлагает быстрый и мощный сравнительный анализ белка и последовательностей нуклеотида против известных последовательностей в онлайновых и локальных базах данных. Отчеты BLAST могут быть длинными, и парсинг данных из различных форматов может быть громоздким.

Data = blastreadlocal(BLASTReport, Format) чтения BLASTReport, локально созданный файл отчета BLAST, и возвращают Data, структуру MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального BLAST, сообщают. Format является целым числом, указывающим, что формат выравнивания раньше создавал BLASTReport.

Примечание

Функция принимает, что отчет BLAST был представлен с помощью версии 2.2.17 исполняемого файла blastall.

Data содержит подмножество следующих полей, на основе заданного формата выравнивания.

Поле Описание
AlgorithmАлгоритм NCBI раньше делал поиск BLAST.
QueryИдентификатор последовательности запроса подвергается поиску BLAST.
LengthДлина последовательности запроса.
DatabaseВсе базы данных ищутся.
Hits.NameИмя последовательности базы данных (подвергают последовательность), который совпадал с последовательностью запроса.
Hits.ScoreСчет выравнивания между последовательностью запроса и подчиненной последовательностью.
Hits.ExpectЗначение ожидания для выравнивания между последовательностью запроса и подчиненной последовательностью.
Hits.LengthДлина подчиненной последовательности.
Hits.HSPs.ScoreПопарный счет выравнивания к высоко выигрывающей паре последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.ExpectЗначение ожидания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.IdentitiesТождества (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.Positives

Идентичные или подобные остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот.

Примечание

Это поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и/или базам данных.

Hits.HSPs.Gaps

Неприсоединившиеся остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.Mismatches

Остатки, которые не подобны друг другу (соответствие, возможны, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.Frame

Рамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Примечание

Это поле применяется только, когда выполнение перевело поисковые запросы, то есть, при использовании tblastx, tblastn и blastx.

Hits.HSPs.Strand

Смысл (Plus = 5' к 3' и Minus = 3' к 5') нитей ДНК для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Примечание

Это поле применяется только при использовании последовательности запроса нуклеотида и базы данных.

Hits.HSPs.Alignment

Матрица с тремя строками, показывающая выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.QueryIndices

Индексы положений остатка последовательности запроса для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.SubjectIndices

Индексы подчиненных положений остатка последовательности для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.AlignmentLength

Продолжительность попарного выравнивания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Alignment

Целое выравнивание для последовательности запроса и подчиненной последовательности (последовательностей).

Statistics

Сводные данные статистических деталей о выполняемом поиске, таких как значения lambda, разрывают штрафы, количество последовательностей, искавших и количество хитов.

Примеры

Следующие примеры принимают, что у вас есть файл нуклеотида FASTA для E. coli, такого как файл NC_004431.fna.

 Пример 6. Чтение данных Используя табличный формат выравнивания
  1. Создайте локальную blastable базу данных из файла FASTA NC_004431.fna.

    blastformat('inputdb', 'NC_004431.fna', 'protein', 'false');
  2. Используйте функцию getgenbank, чтобы получить две последовательности из базы данных GenBank®.

    S1 = getgenbank('M28570.1');
    S2 = getgenbank('M12565');
  3. Создайте файл запроса при помощи функции fastawrite, чтобы создать файл с именем FASTA query_multi_nt.fa из этих двух последовательностей, с помощью единственного инвентарного номера в качестве заголовка.

    Seqs(1).Header = S1.Accession;
    Seqs(1).Sequence = S1.Sequence;
    Seqs(2).Header = S2.Accession;
    Seqs(2).Sequence = S2.Sequence;
    fastawrite('query_multi_nt.fa', Seqs);
  4. Представьте последовательности запроса в файле FASTA query_multi_nt.fa для поиска BLAST локальной базы данных NC_004431.fna нуклеотида. Задайте программу BLAST blastn и табличный формат выравнивания. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt8.txt, и затем читают локальный отчет BLAST.

    blastlocal('inputquery', 'query_multi_nt.fa',...
               'database', 'NC_004431.fna',...
               'tofile', 'myecoli_nt8.txt', 'program', 'blastn',...
               'format', 8);
    blastreadlocal('myecoli_nt8.txt', 8);
    
 Пример 7. Чтение данных Используя запрос привязанный формат
  1. Если вы уже не сделали так, создайте локальную blastable базу данных и файл запроса, как описано ранее.

  2. Представьте последовательности запроса в файле FASTA query_multi_nt.fa для поиска BLAST локальной базы данных NC_004431.fna нуклеотида. Задайте программу BLAST blastn и привязанный запросом формат. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt1.txt, и затем читают локальный отчет BLAST, сохраняя результаты в results, массиве структур.

    blastlocal('inputquery', 'query_multi_nt.fa',...
               'database', 'NC_004431.fna',...
               'tofile', 'myecoli_nt1.txt', 'program', 'blastn',...
               'format', 1);
    results = blastreadlocal('myecoli_nt1.txt', 1);
    

Ссылки

[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.

[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.

Для получения дополнительной информации о чтении и интерпретации отчетов BLAST, см.:

Смотрите также

| | | |

Представленный в R2007b