Новые N-граммы, заданные как массив строк, вектор символов или массив ячеек из символьных векторов.
Если newNgrams
является массивом строк или массивом ячеек, то это имеет размер NumNgrams
-by-maxN
, где NumNgrams
является количеством N-грамм, и maxN
является длиной самой большой n-граммы. Если newNgrams
является вектором символов, то он представляет отдельное слово (униграмма).
Значением newNgrams(i,j)
является j
th слово i
th n-грамма. Если количество слов в i
th n-грамма является меньше, чем maxN
, то остающиеся записи i
th строка newNgrams
пусты.
newNgrams
должен поссориться, или одинаковое число строк как oldNgrams
.
Например, чтобы задать и униграмму "Massachusetts"
и биграмма ["New" "York"]
, задают массив строк 2 на 2 ["Massachusetts" ""; "New" "York"]
, где "Massachusetts"
дополнен одной пустой строкой ""
.
Типы данных: string | char | cell