Новые N-граммы в виде массива строк, вектора символов или массива ячеек из символьных векторов.
Если newNgrams
массив строк или массив ячеек, затем он имеет размер NumNgrams
- maxN
, где NumNgrams
количество N-грамм и maxN
длина самой большой n-граммы. Если newNgrams
вектор символов, затем он представляет отдельное слово (униграмма).
Значение newNgrams(i,j)
j
слово th i
n-грамма th. Если количество слов в i
n-грамма th меньше maxN
, затем остающиеся записи i
строка th newNgrams
пусты.
newNgrams
должен поссориться, или одинаковое число строк как oldNgrams
.
Например, чтобы задать обоих униграмма "Massachusetts"
, и биграмма ["New" "York"]
, задайте массив строк 2 на 2 ["Massachusetts" ""; "New" "York"]
, где "Massachusetts"
дополнен одной пустой строкой ""
.
Типы данных: string
| char
| cell