seqinsertgaps

Вставка зазоров в нуклеотидную или аминокислотную последовательность

Синтаксис

NewSeq = seqinsertgaps(Seq, Positions) NewSeq = seqinsertgaps(Seq, GappedSeq) NewSeq = seqinsertgaps(Seq, GappedSeq, Relationship)

Входные аргументы

`Seq`	Одно из следующих действий: Символьный вектор или строка, указывающая нуклеотидную или аминокислотную последовательность Структура MATLAB ®, содержащая `Sequence` область
`Positions`	Вектор целых чисел для указания позиций в `Seq` перед которой следует вставить зазор.
`GappedSeq`	Одно из следующих действий: Символьный вектор или строка, указывающая нуклеотидную или аминокислотную последовательность Структура MATLAB, содержащая `Sequence` область
`Relationship`	Целое число, указывающее отношение между `Seq` и `GappedSeq`. Возможны следующие варианты: `1` Обе последовательности используют одинаковый алфавит, то есть обе являются нуклеотидными последовательностями или обе являются аминокислотными последовательностями. `3` — `Seq` содержит нуклеотиды, представляющие кодоны и `GappedSeq` содержит аминокислоты (по умолчанию).

Выходные аргументы

NewSeq Последовательность с введенными пробелами, представленная вектором символов, определяющим нуклеотидную или аминокислотную последовательность.

Описание

NewSeq = seqinsertgaps(Seq, Positions) вставляет промежутки в последовательность Seq перед позициями, заданными целыми числами в векторе Positions.

NewSeq = seqinsertgaps(Seq, GappedSeq) находит положения промежутка в последовательности GappedSeq, затем вставляет промежутки в соответствующие положения в последовательности Seq.

NewSeq = seqinsertgaps(Seq, GappedSeq, Relationship) задает отношение между Seq и GappedSeq. Войти 1 для Relationship когда обе последовательности используют один и тот же алфавит, то есть обе являются нуклеотидными последовательностями или обе являются аминокислотными последовательностями. Войти 3 для Relationship когда Seq содержит нуклеотиды, представляющие кодоны и GappedSeq содержит аминокислоты. По умолчанию: 3.

Примеры

Извлекают две нуклеотидные последовательности из базы данных GenBank ® для белка нейраминидазы (NA) двух штаммов вируса гриппа А (H5N1).
```
 hk01 = getgenbank('AF509094');
 vt04 = getgenbank('DQ094287');
```
Извлекают кодирующую область из двух нуклеотидных последовательностей.
```
hk01_cds = featureparse(hk01,'feature','CDS','Sequence',true);
vt04_cds = featureparse(vt04,'feature','CDS','Sequence',true);
```
Выравнивают аминокислотные последовательности, преобразованные из нуклеотидных последовательностей.
```
 [sc,al]=nwalign(nt2aa(hk01_cds),nt2aa(vt04_cds),'extendgap',1);
```
Используйте seqinsertgaps функция для копирования зазоров из выровненных аминокислотных последовательностей в их соответствующие нуклеотидные последовательности, таким образом, выравнивая их кодонами.
```
 hk01_aligned = seqinsertgaps(hk01_cds,al(1,:))
 vt04_aligned = seqinsertgaps(vt04_cds,al(3,:))
```
После выравнивания кода между двумя последовательностями их можно использовать в качестве входных данных для других функций, таких как dnds, которая вычисляет скорости синонимических и несинонимических замен нуклеотидных последовательностей, выровненных по кодону. По настройке Verbose кому true, вы также можете отобразить кодоны, рассмотренные в вычислениях, и их аминокислотные трансляции.
```
[dn,ds] = dnds(hk01_aligned,vt04_aligned,'verbose',true)
```

См. также

dnds | dndsml | featureparse | int2aa | int2nt

Представлен в R2007a

Документация