multialignread

Считайте файл выравнивания нескольких последовательностей

Синтаксис

S = multialignread(File)
[Headers, Sequences] = multialignread(File)
... = multialignread(File, 'IgnoreGaps', IgnoreGapsValue)
... = multialignread(File, 'TimeOut', TimeOutValue)

Входные параметры

File

Файл выравнивания нескольких последовательностей, заданный одним из следующих:

  • Имя файла или путь и имя файла

  • URL-адрес, указывающий на файл

  • MATLAB® символьный массив, содержащий текст файла выравнивания с несколькими последовательностями

Можно считать общие типы файлов выравнивания нескольких последовательностей, такие как ClustalW (.aln), GCG (.msf) и PHYLIP.

IgnoreGapsValueУправляет удалением символов зазора, таких как '-' или '.', из последовательностей. Варианты true или false (по умолчанию).
TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

S

Массив структуры MATLAB, содержащий следующие поля:

  • Header - Информация о заголовке из файла.

  • Sequence - аминокислотные или нуклеотидные последовательности.

Headers

Массив ячеек, содержащий информацию о заголовке из файла.

Sequences

Массивы ячеек, содержащие аминокислотные или нуклеотидные последовательности.

Описание

S = multialignread(File) считывает файл выравнивания нескольких последовательностей. Файл содержит несколько линий последовательности, которые начинаются с заголовка последовательности, за которым следует дополнительный номер (не используется multialignread) и раздел последовательности. Множественные последовательности разбиваются на блоки с одинаковым количеством блоков для каждой последовательности. Чтобы просмотреть пример файла выравнивания нескольких последовательностей, введите open aagag.aln в командной строке MATLAB.

Выход, S, является массивом структур, где S.Header содержит информацию о заголовке и S.Sequence содержит аминокислотные или нуклеотидные последовательности.

[Headers, Sequences] = multialignread(File) считывает файл в отдельные переменные, Headers и Sequences, которые являются массивами ячеек, содержащими заголовочную информацию и аминокислотные или нуклеотидные последовательности, соответственно.

... = multialignread(File, 'IgnoreGaps', IgnoreGapsValue) управляет удалением любого символа зазора, такого как '-' или '.', из последовательностей. Варианты true или false (по умолчанию).

... = multialignread(File, 'TimeOut', TimeOutValue) устанавливает тайм-аут подключения (в секундах), чтобы считать данные из удаленного файла или URL-адреса.

Примеры

Считайте выравнивание нескольких последовательностей gag полипротеина для нескольких штаммов ВИЧ.

gagaa = multialignread('aagag.aln')

gagaa = 

1x16 struct array with fields:
    Header
    Sequence
Представлено до R2006a