Найдите самых близких соседей расстоянием редактирования
Создайте искателя расстояния редактирования.
vocabulary = ["MathWorks" "MATLAB" "Simulink"]; eds = editDistanceSearcher(vocabulary,2);
Найдите самые близкие слова к "MALTAB"
и "MatWorks"
.
words = ["MALTAB" "MatWorks"]; idx = knnsearch(eds,words)
idx = 2×1
2
1
Получите слова из словаря с помощью возвращенных индексов.
nearestWords = eds.Vocabulary(idx)
nearestWords = 1x2 string array
"MATLAB" "MathWorks"
Создайте искателя расстояния редактирования.
vocabulary = ["MATLAB" "Simulink" "MathWorks"]; eds = editDistanceSearcher(vocabulary,2);
Найдите самые близкие слова и их расстояния редактирования до "MatWorks"
и "MALTAB"
.
words = ["MatWorks" "MALTAB"]; [idx,d] = knnsearch(eds,words)
idx = 2×1
3
1
d = 2×1
1
2
Получите слова из словаря с помощью возвращенных индексов.
nearestWords = eds.Vocabulary(idx)
nearestWords = 1x2 string array
"MathWorks" "MATLAB"
Изменение слова "MatWorks"
к "MathWorks"
требует одного редактирования: вставка. Изменение слова "MALTAB"
в "MATLAB"
требует двух редактирований: удаление и вставка.
Создайте искателя расстояния редактирования.
vocabulary = ["MathWorks" "MATLAB" "Analytics"]; eds = editDistanceSearcher(vocabulary,5);
Найдите два самых близких слова и их расстояния редактирования до "Math"
и "Analysis"
.
words = ["Math" "Analysis"]; idx = knnsearch(eds,words,'K',2)
idx = 2×2
1 2
3 NaN
Просмотрите два самых близких слова к "Math"
.
idxMath = idx(1,:); newWords = eds.Vocabulary(idxMath)
newWords = 1x2 string array
"MathWorks" "MATLAB"
Существует только одно слово на максимальном расстоянии редактирования от "Analysis"
, таким образом, функция возвращает NaN
для других индексов. Просмотрите самые близкие слова с допустимыми индексами.
idxAnalysis = idx(2,:); idxAnalysis(isnan(idxAnalysis)) = []; newWords = eds.Vocabulary(idxAnalysis)
newWords = "Analytics"
eds
— Отредактируйте искателя расстоянияeditDistanceSearcher
Отредактируйте искателя расстояния, заданного как editDistanceSearcher
объект.
words
— Введите словаВведите слова, заданные как вектор строки, вектор символов или массив ячеек из символьных векторов. Если вы задаете words
как вектор символов, затем функция обрабатывает аргумент как отдельное слово.
Типы данных: string
| char
| cell
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
knnsearch(eds,words,'K',3)
находит самые близкие трех соседей в eds
к элементам words
. 'K'
— Количество самых близких соседей, чтобы найтиКоличество самых близких соседей, чтобы найти для каждого элемента в words
, заданный как положительное целое число.
Пример: 'K',3
Типы данных: single
| double
| int8
| int16
| int32
| int64
| uint8
| uint16
| uint32
| uint64
'IncludeTies'
— Опция, чтобы включать соседей, значения расстояния которых равныfalse
(значение по умолчанию) | true
Опция, чтобы возвратить соседей, значения расстояния которых равны, заданы как true
или false
.
Если 'IncludeTies'
false
, затем функция возвращает соседей K с самым коротким расстоянием редактирования, где K является количеством соседей, чтобы найти. В этом случае, функциональные выходные параметры N-by-K матрицы, где N является количеством входных слов. Чтобы задать K, используйте 'K'
аргумент пары "имя-значение".
Если 'IncludeTies'
true
, затем функция также возвращает соседей, расстояния которых равны K th наименьшее расстояние в выходе. В этом случае, функциональные выходные массивы ячеек размера N-by-1, где N является количеством входных слов. Элементы массивов ячеек являются векторами, по крайней мере, с элементами K. Функциональные виды соседи в каждом векторе в порядке возрастания расстояния.
Пример: 'IncludeTies',true
Типы данных: логический
idx
— Индексы самых близких соседей в искателеИндексы самых близких соседей в искателе, возвращенном как матрица или массив ячеек векторов.
Если 'IncludeTies'
false
, затем функция возвращает соседей K с самым коротким расстоянием редактирования, где K является количеством соседей, чтобы найти. В этом случае, функциональные выходные параметры N-by-K матрицы, где N является количеством входных слов. Чтобы задать K, используйте 'K'
аргумент пары "имя-значение".
Если 'IncludeTies'
true
, затем функция также возвращает соседей, расстояния которых равны K th наименьшее расстояние в выходе. В этом случае, функциональные выходные массивы ячеек размера N-by-1, где N является количеством входных слов. Элементы массивов ячеек являются векторами, по крайней мере, с элементами K. Функциональные виды соседи в каждом векторе в порядке возрастания расстояния.
Типы данных: double |
cell
d
— Отредактируйте расстояния до соседейОтредактируйте расстояния до соседей, возвращенных как матрица или массив ячеек векторов.
Если 'IncludeTies'
false
, затем функция возвращает соседей K с самым коротким расстоянием редактирования, где K является количеством соседей, чтобы найти. В этом случае, функциональные выходные параметры N-by-K матрицы, где N является количеством входных слов. Чтобы задать K, используйте 'K'
аргумент пары "имя-значение".
Если 'IncludeTies'
true
, затем функция также возвращает соседей, расстояния которых равны K th наименьшее расстояние в выходе. В этом случае, функциональные выходные массивы ячеек размера N-by-1, где N является количеством входных слов. Элементы массивов ячеек являются векторами, по крайней мере, с элементами K. Функциональные виды соседи в каждом векторе в порядке возрастания расстояния.
Типы данных: double |
cell
editDistance
| editDistanceSearcher
| rangesearch
| splitGraphemes
| tokenizedDocument
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.