newBag = removeInfrequentNgrams(bag,count) удаляет n-граммы, которые появляются самое большее count суммарное время из модели сумки n-граммов bag. Функция по умолчанию чувствительна к регистру.
newBag = removeInfrequentNgrams(bag,count,'NgramLengths',lengths) удаляет только n-граммы с длинами, заданными lengths. Функция по умолчанию чувствительна к регистру.
newBag = removeInfrequentNgrams(___,'IgnoreCase',true) удаляет n-граммы, которые появляются самое большее count время игнорирования случая. Если n-граммы различаются только по регистрам, то соответствующие счетчики объединяются.
Загрузите данные примера. Файл sonnetsPreprocessed.txt содержит предварительно обработанные версии сонетов Шекспира. Файл содержит по одному сонету на линию со словами, разделенными пространством. Извлеките текст из sonnetsPreprocessed.txtразделите текст на документы в символах новой строки, а затем пометьте его токеном.
Входная модель bag-of-n-gams, заданная как bagOfNgrams объект.
count - Счетный порог положительное целое число
Порог счетчика, заданное как положительное целое число. Функция удаляет n-граммы, которые появляются count раз в общей сложности или меньше.
lengths - N-граммовые длины положительное целое число | вектор положительных целых чисел
N-граммовые длины, заданные как положительное целое число или вектор положительных целых чисел.
Если вы задаете lengthsфункция удаляет нечастые n-граммы только заданных длин. Если вы не задаете lengths, тогда функция удаляет нечастые n-граммы независимо от длины.
Для просмотра документации необходимо авторизоваться на сайте
Памятка переводчика
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.