Количество вхождений слова в последовательности
seqwordcount(Seq, Word)
Seq | Вектор символов или строка, содержащая нуклеотидную или аминокислотную последовательность. Вы также можете ввести структуру с полем |
Word | Введите короткую последовательность символов. |
seqwordcount( подсчитывает количество раз, когда слово появляется в последовательности, а затем возвращает количество вхождений этого слова.Seq, Word)
Если Word содержит нуклеотидные или аминокислотные символы, которые представляют несколько возможных символов (неоднозначные символы), затем seqwordcount считает все совпадения. Для примера символ R представляет либо G или A (пурины). Для другого примера, если word равен 'ART', затем seqwordcount отсчитывает вхождения обоих 'AAT' и 'AGT'.
seqwordcount не подсчитывает перекрывающиеся шаблоны несколько раз. В следующем примере seqwordcount сообщает три матча. TATATATA учитывается как два различных соответствия, а не как три перекрываемых вхождений.
seqwordcount('GCTATAACGTATATATAT','TATA') ans = 3
В следующем примере сообщается о двух совпадениях ('TAGT' и 'TAAT'). B является неоднозначным кодом для G, T, или C, в то время как R является неоднозначным кодом для G и A.
seqwordcount('GCTAGTAACGTATATATAAT','BART') ans = 2
codoncount | seq2regexp | seqshoworfs | seqviewer | strfind