Разделите текст в предложения
newStr = splitSentences(str)
Если эмотиконы или символы эмодзи появляются после останавливающегося символа пунктуации, то функция разделяет предложение после эмотиконов и эмодзи.
addSentenceDetails
| corpusLanguage
| decodeHTMLEntities
| erasePunctuation
| eraseTags
| eraseURLs
| lower
| tokenizedDocument
| upper