blastlocal

Выполните поиск на локальной базе данных BLAST, чтобы создать отчет BLAST

Синтаксис

blastlocal('InputQuery', InputQueryValue)
Data = blastlocal('InputQuery', InputQueryValue)
... blastlocal(..., 'Program', ProgramValue, ...)
... blastlocal(..., 'Database', DatabaseValue, ...)
... blastlocal(..., 'BlastPath', BlastPathValue, ...)
... blastlocal(..., 'Expect', ExpectValue, ...)
... blastlocal(..., 'Format', FormatValue, ...)
... blastlocal(..., 'ToFile', ToFileValue, ...)
... blastlocal(..., 'Filter', FilterValue, ...)
... blastlocal(..., 'GapOpen', GapOpenValue, ...)
... blastlocal(..., 'GapExtend', GapExtendValue, ...)
... blastlocal(..., 'BLASTArgs', BLASTArgsValue, ...)

Входные параметры

InputQueryValueВектор символов или строка, задающая имя файла или путь и имя файла файла FASTA, содержащего нуклеотид запроса или последовательность (последовательности) аминокислот. (Это соответствует опции blastall -i.)
ProgramValue

Вектор символов или строка, задающая программу BLAST. Выбор:

  • 'blastp' (значение по умолчанию) — Поисковый запрос белка по сравнению с базой данных белка.

  • 'blastn' — Поисковый запрос нуклеотида по сравнению с базой данных нуклеотида.

  • 'blastx' — Ищите переведенный запрос нуклеотида по сравнению с базой данных белка.

  • 'tblastn' — Поисковый запрос белка по сравнению с переведенной базой данных нуклеотида.

  • 'tblastx' — Ищите переведенный запрос нуклеотида по сравнению с переведенной базой данных нуклеотида.

(Аргумент ProgramValue соответствует опции blastall -p.)

DatabaseValueВектор символов или строка, задающая имя файла или путь и имя файла локальной базы данных BLAST (отформатированное использование функции formatdb NCBI), чтобы искать. Значением по умолчанию является локальная версия базы данных nr в текущей папке MATLAB®. (Это соответствует опции blastall -d.)
BlastPathValueВектор символов или строка, задающая полный путь к исполняемому файлу blastall, включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь.
ExpectValueЗначение, задающее статистический порог значения для соответствий против последовательностей базы данных. Выбором является любое вещественное число. Значением по умолчанию является 10. (Это соответствует опции blastall -e.)
FormatValue

Целое число, задающее формат выравнивания результатов поиска BLAST. Выбор:

  • 0 (значение по умолчанию) — Попарно

  • 1 — Привязанные запросом, показывающие тождества

  • 2 — Привязанный запросом, никакие тождества

  • 3 — Плоские привязанные запросом, показывающие тождества

  • 4 — Плоский привязанный запросом, никакие тождества

  • 5 — Привязанный запросом, никакие тождества и тупые концы

  • 6 — Плоский привязанный запросом, никакие тождества и тупые концы

  • 8 — Табличный

  • 9 — Табличный со строками с комментариями

(Это соответствует опции blastall -m.)

ToFileValueВектор символов или строка, задающая имя файла или путь и имя файла, в котором можно сохранить содержимое отчета BLAST. (Это соответствует опции blastall -o.)
FilterValueУправляет применением фильтра (фильтр DUST для blastn программы или фильтр SEG для других программ) к последовательности (последовательностям) запроса. Выбором является true (значение по умолчанию) или false. (Это соответствует опции blastall -F.)
GapOpenValueЦелое число, которое задает штраф за открытие разрыва в выравнивании последовательностей. Значением по умолчанию является -1. (Это соответствует опции blastall -G.)
GapExtendValueЦелое число, которое задает штраф за расширение разрыва в выравнивании последовательностей. Значением по умолчанию является -1. (Это соответствует опции blastall -E.)
BLASTArgsValueNCBI команда blastall, которая является вектором символов или строкой, содержащей один или несколько экземпляров -x и опции, сопоставленной с ним, раньше задавал входные параметры.

Выходные аргументы

DataСтруктура MATLAB или массив структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST и данным из локального отчета BLAST.

Описание

Основное локальное средство поиска выравнивания (BLAST) предлагает быстрый и мощный сравнительный анализ белка и последовательностей нуклеотида против известных последовательностей в онлайновых или локальных базах данных.

Примечание

Чтобы использовать функцию blastlocal, у вас должна быть локальная копия исполняемого файла blastall NCBI (версия 2.2.17), доступная от вашей системы. Запустите загруженный исполняемый файл и сконфигурируйте его для вашей системы. Для удобства рассмотрите размещение исполняемого файла blastall NCBI на вашем системном пути.

blastlocal('InputQuery', InputQueryValue) представляет последовательность (последовательности) запроса, заданную InputQueryValue, файл FASTA, содержащий нуклеотид или последовательность (последовательности) аминокислот, для поиска BLAST локальной базы данных BLAST, путем вызова локальной версии исполняемого файла blastall NCBI. Результаты поиска BLAST отображены в Окне Команды MATLAB. (Это соответствует опции blastall -i.)

Data = blastlocal('InputQuery', InputQueryValue) возвращает результаты поиска BLAST в Data, структуре MATLAB или массиве структур (если несколько последовательностей запроса) содержащий поля, соответствующие ключевым словам BLAST, и данные из локального BLAST сообщают.

Data содержит подмножество следующих полей, на основе заданного формата выравнивания.

Поле Описание
AlgorithmАлгоритм NCBI раньше делал поиск BLAST.
QueryИдентификатор последовательности запроса подвергается поиску BLAST.
LengthДлина последовательности запроса.
DatabaseВсе базы данных ищутся.
Hits.NameИмя последовательности базы данных (подвергают последовательность), который совпадал с последовательностью запроса.
Hits.ScoreСчет выравнивания между последовательностью запроса и подчиненной последовательностью.
Hits.ExpectЗначение ожидания для выравнивания между последовательностью запроса и подчиненной последовательностью.
Hits.LengthДлина подчиненной последовательности.
Hits.HSPs.Score

Попарный счет выравнивания к высоко выигрывающей паре последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.ExpectЗначение ожидания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.IdentitiesТождества (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.Positives

Идентичные или подобные остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью аминокислот.

Примечание

Это поле применяется только к переведенному нуклеотиду или последовательностям запроса аминокислоты и/или базам данных.

Hits.HSPs.Gaps

Неприсоединившиеся остатки (соответствие, возможное, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Hits.HSPs.MismatchesОстатки, которые не подобны друг другу (соответствие, возможны, и процент) для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.FrameРамка считывания переведенной последовательности нуклеотида для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Примечание

Это поле применяется только, когда выполнение перевело поисковые запросы, то есть, при использовании tblastx, tblastn и blastx.

Hits.HSPs.Strand Смысл (Plus = 5' к 3' и Minus = 3' к 5') нитей ДНК для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.

Примечание

Это поле применяется только при использовании последовательности запроса нуклеотида и базы данных.

Hits.HSPs.Alignment Матрица с тремя строками, показывающая выравнивание для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.QueryIndicesИндексы положений остатка последовательности запроса для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.SubjectIndicesИндексы подчиненных положений остатка последовательности для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
Hits.HSPs.AlignmentLengthПродолжительность попарного выравнивания для высоко выигрывающей пары последовательности между последовательностью запроса и подчиненной последовательностью.
AlignmentЦелое выравнивание для последовательности запроса и подчиненной последовательности (последовательностей).
StatisticsСводные данные статистических деталей о выполняемом поиске, таких как значения lambda, разрывают штрафы, количество последовательностей, искавших и количество хитов.

... blastlocal(..., 'PropertyName', PropertyValue, ...) вызывает blastlocal с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие.

... blastlocal(..., 'Program', ProgramValue, ...) задает программу BLAST. Выбором является 'blastp' (значение по умолчанию), 'blastn', 'blastx', 'tblastn' и 'tblastx'. (Это соответствует опции blastall -p.) Для справки в выборе соответствующей программы BLAST, посещения:

... blastlocal(..., 'Database', DatabaseValue, ...) задает локальную базу данных BLAST (отформатированное использование функции formatdb NCBI), чтобы искать. Значением по умолчанию является локальная версия базы данных nr в текущей папке MATLAB. (Это соответствует опции blastall -d.)

... blastlocal(..., 'BlastPath', BlastPathValue, ...) задает полный путь к исполняемому файлу blastall, включая имя и расширение исполняемого файла. Значением по умолчанию является системный путь.

... blastlocal(..., 'Expect', ExpectValue, ...) задает статистический порог значения для соответствий против последовательностей базы данных. Выбором является любое вещественное число. Значением по умолчанию является 10. (Это соответствует опции blastall -e.) Можно узнать больше о статистике локального сравнения последовательности в:

... blastlocal(..., 'Format', FormatValue, ...) задает формат выравнивания результатов поиска BLAST. Выбор:

  • 0 (значение по умолчанию) — Попарно

  • 1 — Привязанные запросом, показывающие тождества

  • 2 — Привязанный запросом, никакие тождества

  • 3 — Плоские привязанные запросом, показывающие тождества

  • 4 — Плоский привязанный запросом, никакие тождества

  • 5 — Привязанный запросом, никакие тождества и тупые концы

  • 6 — Плоский привязанный запросом, никакие тождества и тупые концы

  • 7 — Не используемый

  • 8 — Табличный

  • 9 — Табличный со строками с комментариями

(Это соответствует опции blastall -m.)

... blastlocal(..., 'ToFile', ToFileValue, ...) сохраняет содержимое BLAST, сообщают заданному файлу. (Это соответствует опции blastall -o.)

... blastlocal(..., 'Filter', FilterValue, ...) задает, применяется ли фильтр (фильтр DUST для blastn программы или фильтр SEG для других программ) к последовательности (последовательностям) запроса. Выбором является true (значение по умолчанию) или false. (Это соответствует опции blastall -F.)

... blastlocal(..., 'GapOpen', GapOpenValue, ...) задает штраф за открытие разрыва в выравнивании последовательностей. Значением по умолчанию является -1. (Это соответствует опции blastall -G.)

... blastlocal(..., 'GapExtend', GapExtendValue, ...) задает штраф за расширение разрыва в выравнивании последовательностей. Значением по умолчанию является -1. (Это соответствует опции blastall -E.)

... blastlocal(..., 'BLASTArgs', BLASTArgsValue, ...) задает опции с помощью входных параметров для функции blastall NCBI. BLASTArgsValue является вектором символов или строкой, содержащей один или несколько экземпляров или -x и опция, сопоставленная с ним. Например, чтобы задать матрицу BLOSUM 45, вы использовали бы следующий синтаксис:

blastlocal('InputQuery', ecoliquery.txt, 'BLASTArgs', '-M BLOSUM45')

Совет

Используйте свойство 'BlastArgs' задать опции blastall, для которых нет никакого соответствующего имени свойства / пар значения свойства.

Примечание

Для полного списка допустимых входных параметров для функции blastall NCBI убедитесь, что исполняемый файл blastall расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.

blastall -

Используя blastall Синтаксис

Можно также использовать синтаксис и входные параметры, принятые функцией blastall NCBI вместо имени свойства / пары значения свойства, перечисленные ранее. Для этого предоставьте вектор символов или строку, содержащую несколько опций с помощью синтаксиса option -x. Например, можно задать файл FASTA ecoliquery.txt как последовательности запроса, программу blastp и локальную базу данных ecoli, при помощи

blastlocal('-i ecoliquery.txt -p blastp -d ecoli')

Примечание

Для полного списка допустимых входных параметров для функции blastall NCBI убедитесь, что исполняемый файл blastall расположен на вашем системном пути или текущей папке, затем введите следующее в командной строке своей системы.

blastall -

Примеры

Следующие примеры принимают, что у вас есть файл нуклеотида FASTA и файл аминокислоты FASTA для E. coli, такого как файлы NC_004431.fna и NC_004431.faa, сохраненный в вашу текущую папку MATLAB.

 Пример 3. Выполнение нуклеотида переведенный поиск
  1. Создайте локальные blastable базы данных из NC_004431.fna и NC_004431.faa файлы FASTA при помощи функции blastformat.

    blastformat('inputdb', 'NC_004431.fna', 'protein', 'false');
    blastformat('inputdb', 'NC_004431.faa');
  2. Используйте функцию getgenbank, чтобы получить информацию о последовательности для E. coli оперон треонина от базы данных GenBank®.

    S = getgenbank('M28570');
  3. Создайте файл запроса при помощи функции fastawrite, чтобы создать файл с именем FASTA query_nt.fa из этой информации о последовательности, с помощью только инвентарный номер в качестве заголовка.

    S.Header = S.Accession;
    fastawrite('query_nt.fa', S);
  4. Используйте синтаксис MATLAB, чтобы представить последовательность запроса в файле FASTA query_nt.fa для поиска BLAST локальной базы данных NC_004431.faa аминокислоты. Задайте программу BLAST blastx. Возвратите результаты поиска BLAST в results, структуре MATLAB.

    results = blastlocal('inputquery', 'query_nt.fa',...
                         'database', 'NC_004431.faa',...
                         'program',  'blastx');
 Пример 4. Выполнение Поиска Нуклеотида Используя blastall Синтаксис
  1. Если вы уже не сделали так, создайте локальные blastable базы данных и файл запроса, как описано ранее.

  2. Используйте синтаксис blastall, чтобы представить последовательность запроса в файле FASTA query_nt.fa для поиска BLAST локальной базы данных NC_004431.fna нуклеотида. Задайте программу BLAST blastn и значение ожидания 0.0001. Возвратите результаты поиска BLAST в results, структуре MATLAB.

    results = blastlocal('-i query_nt.fa -d NC_004431.fna ...
                          -p blastn -e 0.0001');
 Пример 5. Выполнение поиска нуклеотида и создание отформатированного отчета
  1. Если вы уже не сделали так, создайте локальные blastable базы данных и файл запроса, как описано ранее.

  2. Представьте последовательность запроса в файле FASTA query_nt.fa для поиска BLAST локальной базы данных NC_004431.fna нуклеотида. Задайте программу BLAST blastn и табличный формат выравнивания. Сохраните содержимое BLAST, сообщают файлу с именем о myecoli_nt.txt.

    blastlocal('inputquery', 'query_nt.fa',...
               'database', 'NC_004431.fna', 'tofile',...
               'myecoli_nt.txt', 'blastargs', '-p blastn -m 8');

Ссылки

[1] Altschul, S.F., Gish, W., Миллер, W., Майерс, E.W., и Липмен, D.J. (1990). Основное локальное средство поиска выравнивания. J. Молекулярная масса Biol. 215, 403–410.

[2] Altschul, S.F., Раздражайте, T.L., Шеффер, A.A., Чжан, J., Чжан, Z., Миллер, W., и Липмен, D.J. (1997). Содержащий разрывы BLAST и PSI-BLAST: новое поколение базы данных белка ищет программы. Нуклеиновые кислоты Res. 25, 3389–3402.

Смотрите также

| | | |

Представленный в R2007b