Количество вхождений слова в последовательности
seqwordcount(
Seq
, Word
)
Seq | Вектор символов или строка, содержащая нуклеотидную или аминокислотную последовательность. Вы также можете ввести структуру с полем |
Word | Введите короткую последовательность символов. |
seqwordcount(
подсчитывает количество раз, когда слово появляется в последовательности, а затем возвращает количество вхождений этого слова.Seq
, Word
)
Если Word
содержит нуклеотидные или аминокислотные символы, которые представляют несколько возможных символов (неоднозначные символы), затем seqwordcount
считает все совпадения. Для примера символ R
представляет либо G
или A
(пурины). Для другого примера, если word
равен 'ART'
, затем seqwordcount
отсчитывает вхождения обоих 'AAT'
и 'AGT'
.
seqwordcount
не подсчитывает перекрывающиеся шаблоны несколько раз. В следующем примере seqwordcount
сообщает три матча. TATATATA
учитывается как два различных соответствия, а не как три перекрываемых вхождений.
seqwordcount('GCTATAACGTATATATAT','TATA') ans = 3
В следующем примере сообщается о двух совпадениях ('TAGT'
и 'TAAT'
). B
является неоднозначным кодом для G
, T
, или C
, в то время как R
является неоднозначным кодом для G
и A
.
seqwordcount('GCTAGTAACGTATATATAAT','BART') ans = 2
codoncount
| seq2regexp
| seqshoworfs
| seqviewer
| strfind