seqinsertgaps

Вставьте разрывы в нуклеотид или последовательность аминокислот

Синтаксис

NewSeq = seqinsertgaps(Seq, Positions) NewSeq = seqinsertgaps(Seq, GappedSeq) NewSeq = seqinsertgaps(Seq, GappedSeq, Relationship)

Входные параметры

`Seq`	Любое из следующего: Вектор символов или строка, задающая нуклеотид или последовательность аминокислот Структура MATLAB^®, содержащая поле `Sequence`
`Positions`	Вектор целых чисел, чтобы задать положения в `Seq`, перед которым можно вставить разрыв.
`GappedSeq`	Любое из следующего: Вектор символов или строка, задающая нуклеотид или последовательность аминокислот Структура MATLAB, содержащая поле `Sequence`
`Relationship`	Целое число, задающее отношение между `Seq` и `GappedSeq`. Выбор: `1` — Обе последовательности используют тот же алфавит, который является, оба последовательности нуклеотида, или оба - последовательности аминокислот. `3` — `Seq` содержит нуклеотиды, представляющие кодоны, и `GappedSeq` содержит аминокислоты (значение по умолчанию).

Выходные аргументы

NewSeq Последовательность с разрывами, вставленными, представленными вектором символов, задающим нуклеотид или последовательность аминокислот.

Описание

NewSeq = seqinsertgaps(Seq, Positions) вставляет разрывы в последовательность Seq перед положениями, заданными целыми числами в векторном Positions.

NewSeq = seqinsertgaps(Seq, GappedSeq) находит положения разрыва в последовательности GappedSeq, затем вставляет разрывы в соответствующие положения в последовательности Seq.

NewSeq = seqinsertgaps(Seq, GappedSeq, Relationship) задает отношение между Seq и GappedSeq. Введите 1 для Relationship, когда обе последовательности используют тот же алфавит, который является, оба последовательности нуклеотида, или оба - последовательности аминокислот. Введите 3 для Relationship, когда Seq содержит нуклеотиды, представляющие кодоны, и GappedSeq содержит аминокислоты. Значением по умолчанию является 3.

Примеры

Получите две последовательности нуклеотида из базы данных GenBank^® для нейраминидазы (NA) белок двух деформаций Гриппа вирус (H5N1).
```
 hk01 = getgenbank('AF509094');
 vt04 = getgenbank('DQ094287');
```
Извлеките область кодирования от двух последовательностей нуклеотида.
```
hk01_cds = featuresparse(hk01,'feature','CDS','Sequence',true);
vt04_cds = featuresparse(vt04,'feature','CDS','Sequence',true);
```
Выровняйте последовательности аминокислот, преобразованные от последовательностей нуклеотида.
```
 [sc,al]=nwalign(nt2aa(hk01_cds),nt2aa(vt04_cds),'extendgap',1);
```
Используйте функцию seqinsertgaps, чтобы скопировать разрывы от выровненных последовательностей аминокислот до их соответствующих последовательностей нуклеотида, таким образом выравнивание кодона их.
```
 hk01_aligned = seqinsertgaps(hk01_cds,al(1,:))
 vt04_aligned = seqinsertgaps(vt04_cds,al(3,:))
```
Если у вас есть код, выровнял эти две последовательности, можно использовать их в качестве входа к другим функциям, таким как dnds, который вычисляет синонимичные и несинонимичные уровни замен выровненных кодоном последовательностей нуклеотида. Установкой Verbose к true можно также отобразить кодоны, рассмотренные в вычислениях и их переводах аминокислоты.
```
[dn,ds] = dnds(hk01_aligned,vt04_aligned,'verbose',true)
```

Смотрите также

dnds | dndsml | int2aa | int2nt

Документация