newBag = removeInfrequentNgrams(bag,count) удаляет n-граммы, которые появляются не более count общее количество раз из модели мешка n-граммов bag. Функция по умолчанию чувствительна к регистру.
newBag = removeInfrequentNgrams(bag,count,'NgramLengths',lengths) удаляет только n-грамм с заданными длинами lengths. Функция по умолчанию чувствительна к регистру.
newBag = removeInfrequentNgrams(___,'IgnoreCase',true) удаляет n-граммы, которые появляются не более count раз игнорируя случай. Если n-грамм различаются только в зависимости от случая, то соответствующие счётчики объединяются.
Загрузите данные примера. Файл sonnetsPreprocessed.txt содержит предварительно обработанные версии сонетов Шекспира. Файл содержит один сонет на строку со словами, разделенными пробелом. Извлечь текст из sonnetsPreprocessed.txtразделите текст на документы с новыми символами, а затем пометьте документы.
bag - Модель входного мешка n-грамм bagOfNgrams объект
Входная модель мешка n-граммов, указанная как bagOfNgrams объект.
count - Порог подсчета положительное целое число
Пороговое значение счетчика, указанное как положительное целое число. Функция удаляет отображаемые n-граммы count всего или меньше.
lengths - N-граммовые длины положительное целое число | вектор положительных целых чисел
N-граммовые длины, определенные как положительное целое число или вектор положительных целых чисел.
При указании lengthsфункция удаляет только нечастые n-граммы указанных длин. Если не указать lengths, то функция удаляет нечастые n-грамм независимо от длины.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.