knnsearch

Найдите самых близких соседей расстоянием редактирования

Синтаксис

idx = knnsearch(eds,words)

[idx,d] = knnsearch(eds,words)

[idx,d] = knnsearch(eds,words,Name,Value)

Описание

idx = knnsearch(eds,words) находит индексы самых близких соседей в искателе расстояния редактирования eds к каждому элементу в words.

пример

[idx,d] = knnsearch(eds,words) также возвращает расстояния редактирования между элементами words и самых близких соседей.

пример

[idx,d] = knnsearch(eds,words,Name,Value) задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".

Примеры

свернуть все

Найдите самые близкие слова

Скрипт Open Live Script

Создайте искателя расстояния редактирования.

vocabulary = ["MathWorks" "MATLAB" "Simulink"];
eds = editDistanceSearcher(vocabulary,2);

Найдите самые близкие слова к "MALTAB" и "MatWorks".

words = ["MALTAB" "MatWorks"];
idx = knnsearch(eds,words)

idx = 2×1

     2
     1

Получите слова из словаря с помощью возвращенных индексов.

nearestWords = eds.Vocabulary(idx)

nearestWords = 1x2 string array
    "MATLAB"    "MathWorks"

Найдите расстояния редактирования до самых близких слов

Скрипт Open Live Script

Создайте искателя расстояния редактирования.

vocabulary = ["MATLAB" "Simulink" "MathWorks"];
eds = editDistanceSearcher(vocabulary,2);

Найдите самые близкие слова и их расстояния редактирования до "MatWorks" и "MALTAB".

words = ["MatWorks" "MALTAB"];
[idx,d] = knnsearch(eds,words)

idx = 2×1

     3
     1

Получите слова из словаря с помощью возвращенных индексов.

nearestWords = eds.Vocabulary(idx)

nearestWords = 1x2 string array
    "MathWorks"    "MATLAB"

При изменении слова "MatWorks" на "MathWorks" требует одного редактирования: вставка. При изменении слова "MALTAB" в "MATLAB" требует двух редактирований: удаление и вставка.

Найдите несколько соседей

Скрипт Open Live Script

Создайте искателя расстояния редактирования.

vocabulary = ["MathWorks" "MATLAB" "Analytics"];
eds = editDistanceSearcher(vocabulary,5);

Найдите два самых близких слова и их расстояния редактирования до "Math" и "Analysis".

words = ["Math" "Analysis"];
idx = knnsearch(eds,words,'K',2)

idx = 2×2

     1     2
     3   NaN

Просмотрите два самых близких слова к "Math".

idxMath = idx(1,:);
newWords = eds.Vocabulary(idxMath)

newWords = 1x2 string array
    "MathWorks"    "MATLAB"

Существует только одно слово на максимальном расстоянии редактирования от "Analysis", таким образом, функция возвращает NaN для других индексов. Просмотрите самые близкие слова с допустимыми индексами.

idxAnalysis = idx(2,:);
idxAnalysis(isnan(idxAnalysis)) = [];
newWords = eds.Vocabulary(idxAnalysis)

newWords = 
"Analytics"

Входные параметры

свернуть все

`eds` — Отредактируйте искателя расстояния
`editDistanceSearcher`

Отредактируйте искателя расстояния, заданного как объект editDistanceSearcher.

`words` — Введите слова
представьте вектор в виде строки | вектор символов | массив ячеек из символьных векторов

Введите слова, заданные как вектор строки, вектор символов или массив ячеек из символьных векторов. Если вы задаете words как вектор символов, то функция обрабатывает аргумент как отдельное слово.

Типы данных: string | char | cell

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: knnsearch(eds,words,'K',3) находит самые близкие трех соседей в eds к элементам words.

`K` Количество самых близких соседей, чтобы найти
1 (значение по умолчанию) | положительное целое число

Количество самых близких соседей, чтобы найти для каждого элемента в words, заданном как положительное целое число.

Пример: 'K',3

`'IncludeTies'` — Опция, чтобы включать соседей, значения расстояния которых равны
`false` (значение по умолчанию) | `true`

Опция, чтобы возвратить соседей, значения расстояния которых равны, заданы как true или false.

Если 'IncludeTies' является false, то функция возвращает соседей K с самым коротким расстоянием редактирования, где K является количеством соседей, чтобы найти. В этом случае, функциональные выходные параметры N-by-K матрицы, где N является количеством входных слов. Чтобы задать K, используйте аргумент пары "имя-значение" 'K'.

Если 'IncludeTies' является true, то функция также возвращает соседей, расстояния которых равны K th наименьшее расстояние в выводе. В этом случае, функциональные выходные массивы ячеек размера N-by-1, где N является количеством входных слов. Элементы массивов ячеек являются векторами, по крайней мере, с элементами K. Функциональные виды соседи в каждом векторе в порядке возрастания расстояния.

Пример: 'IncludeTies',true

Типы данных: логический

Выходные аргументы

свернуть все

`idx` Индексы самых близких соседей в искателе
матрица | массив ячеек векторов

Индексы самых близких соседей в искателе, возвращенном как матрица или массив ячеек векторов.

Типы данных: double | cell

`d` Отредактируйте расстояния до соседей
матрица | массив ячеек векторов

Отредактируйте расстояния до соседей, возвращенных как матрица или массив ячеек векторов.

Типы данных: double | cell

Документация

knnsearch

Синтаксис

Описание

Примеры

Найдите самые близкие слова

Найдите расстояния редактирования до самых близких слов

Найдите несколько соседей

Входные параметры

`eds` — Отредактируйте искателя расстояния
`editDistanceSearcher`

`words` — Введите слова
представьте вектор в виде строки | вектор символов | массив ячеек из символьных векторов

Аргументы в виде пар имя-значение

`K` Количество самых близких соседей, чтобы найти
1 (значение по умолчанию) | положительное целое число

`'IncludeTies'` — Опция, чтобы включать соседей, значения расстояния которых равны
`false` (значение по умолчанию) | `true`

Выходные аргументы

`idx` Индексы самых близких соседей в искателе
матрица | массив ячеек векторов

`d` Отредактируйте расстояния до соседей
матрица | массив ячеек векторов

Смотрите также

Темы

Введенный в R2019a

Документация Text Analytics Toolbox

Поддержка

Документация

knnsearch

Синтаксис

Описание

Примеры

Найдите самые близкие слова

Найдите расстояния редактирования до самых близких слов

Найдите несколько соседей

Входные параметры

eds — Отредактируйте искателя расстояния editDistanceSearcher

words — Введите слова представьте вектор в виде строки | вектор символов | массив ячеек из символьных векторов

Аргументы в виде пар имя-значение

K Количество самых близких соседей, чтобы найти 1 (значение по умолчанию) | положительное целое число

'IncludeTies' — Опция, чтобы включать соседей, значения расстояния которых равны false (значение по умолчанию) | true

Выходные аргументы

idx Индексы самых близких соседей в искателе матрица | массив ячеек векторов

d Отредактируйте расстояния до соседей матрица | массив ячеек векторов

Смотрите также

Темы

Введенный в R2019a

Документация Text Analytics Toolbox

Поддержка

`eds` — Отредактируйте искателя расстояния
`editDistanceSearcher`

`words` — Введите слова
представьте вектор в виде строки | вектор символов | массив ячеек из символьных векторов

`K` Количество самых близких соседей, чтобы найти
1 (значение по умолчанию) | положительное целое число

`'IncludeTies'` — Опция, чтобы включать соседей, значения расстояния которых равны
`false` (значение по умолчанию) | `true`

`idx` Индексы самых близких соседей в искателе
матрица | массив ячеек векторов

`d` Отредактируйте расстояния до соседей
матрица | массив ячеек векторов