editDistanceSearcher

Отредактируйте расстояние самый близкий соседний искатель

Описание

Искатель расстояния редактирования выполняет самый близкий поиск окружения в списке известных строк, с помощью расстояния редактирования.

Создание

Описание

пример

eds = editDistanceSearcher(vocabulary,maxDist) создает искателя расстояния редактирования и устанавливает Vocabulary и MaximumDistance свойства. Возвращенный объект ищет слова в vocabulary и с максимальным расстоянием редактирования maxDist.

пример

eds = editDistanceSearcher(vocabulary,maxDist,Name,Value) задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".

Свойства

развернуть все

Слова, чтобы выдержать сравнение с в виде вектора строки, вектора символов или массива ячеек из символьных векторов.

Типы данных: char | string | cell

Максимальное расстояние редактирования в виде положительной скалярной величины.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

Стойте, чтобы вставить графему в виде неотрицательного скаляра или указателя на функцию.

Если InsertCost указатель на функцию, затем функция должна принять один вход и возвратить стоимость вставки входа к источнику. Функция стоимости должна иметь форму cost = func(grapheme), куда функция возвращает стоимость вставки grapheme в исходную строку.

Если вы задаете пользовательскую функцию стоимости, то искатель выполняет исчерпывающий поиск. Для больших словарей, функций knnsearch и rangesearch может занять много времени, чтобы найти соответствия.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | function_handle

Стойте, чтобы удалить графему в виде неотрицательного скаляра или указателя на функцию.

Если DeleteCost указатель на функцию, затем функция должна принять один вход и возвратить стоимость удаления входа из источника. Функция стоимости должна иметь форму cost = func(grapheme), куда функция возвращает стоимость удаления grapheme от исходной строки.

Если вы задаете пользовательскую функцию стоимости, то искатель выполняет исчерпывающий поиск. Для больших словарей, функций knnsearch и rangesearch может занять много времени, чтобы найти соответствия.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | function_handle

Стойте, чтобы заменить графемой в виде неотрицательного скаляра или указателя на функцию.

Если SubstituteCost указатель на функцию, затем функция должна принять точно два входных параметров и возвратить стоимость замены первым входом к второму в источнике. Функция стоимости должна иметь форму cost = func(grapheme1,grapheme2), куда функция возвращает стоимость замены grapheme1 с grapheme2 в источнике.

Если вы задаете пользовательскую функцию стоимости, то искатель выполняет исчерпывающий поиск. Для больших словарей, функций knnsearch и rangesearch может занять много времени, чтобы найти соответствия.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | function_handle

Стойте, чтобы подкачать смежные графемы в виде неотрицательного скаляра или указателя на функцию.

Если SwapCost указатель на функцию, затем функция должна принять точно два входных параметров и возвратить стоимость свопинга первого входа со вторым в источнике. Функция стоимости должна иметь форму cost = func(grapheme1,grapheme2), куда функция возвращает стоимость свопинга смежных графем grapheme1 и grapheme2 в источнике.

Если вы задаете пользовательскую функцию стоимости, то искатель выполняет исчерпывающий поиск. Для больших словарей, функций knnsearch и rangesearch может занять много времени, чтобы найти соответствия.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | function_handle

Функции объекта

rangesearchНайдите самых близких соседей областью значений расстояния редактирования
knnsearchНайдите самых близких соседей расстоянием редактирования

Примеры

свернуть все

Создайте искателя расстояния редактирования расстояние редактирования имеющее 3 от слов "MathWorks"MATLAB, и "Analytics".

vocabulary = ["MathWorks" "MATLAB" "Analytics"];
eds = editDistanceSearcher(vocabulary,3)
eds = 
  editDistanceSearcher with properties:

         Vocabulary: ["MathWorks"    "MATLAB"    "Analytics"]
    MaximumDistance: 3
         InsertCost: 1
         DeleteCost: 1
     SubstituteCost: 1
           SwapCost: Inf

Создайте искателя расстояния редактирования, использующего расстояние редактирования Damerau-Levenshtein. Расстояние редактирования Damerau-Levenshtein является самым низким количеством вставок, удалений, замен и подкачек.

Создайте искателя расстояния редактирования из слов "MathWorks"MATLAB, и "Analytics" и задайте максимальное расстояние 3. Чтобы задать расстояние редактирования Damerau-Levenshtein, установите 'SwapCost' к 1.

vocabulary = ["MathWorks" "MATLAB" "Analytics"];
eds = editDistanceSearcher(vocabulary,3,'SwapCost',1)
eds = 
  editDistanceSearcher with properties:

         Vocabulary: ["MathWorks"    "MATLAB"    "Analytics"]
    MaximumDistance: 3
         InsertCost: 1
         DeleteCost: 1
     SubstituteCost: 1
           SwapCost: 1

Создайте искателя расстояния редактирования.

vocabulary = ["Text" "Analytics" "Toolbox"];
eds = editDistanceSearcher(vocabulary,2);

Найдите самые близкие слова к "Test" и "Analysis".

words = ["Test" "Analysis"];
idx = knnsearch(eds,words)
idx = 2×1

     1
     2

Получите слова из словаря с помощью возвращенных индексов.

nearestWords = eds.Vocabulary(idx)
nearestWords = 1x2 string
    "Text"    "Analytics"

Создайте искателя расстояния редактирования и задайте максимальное расстояние редактирования 3.

vocabulary = ["MathWorks" "MATLAB" "Simulink" "text" "analytics" "analysis"];
maxDist = 3;
eds = editDistanceSearcher(vocabulary,maxDist);

Найдите самые близкие слова к "test", "analytic", и "analyze" с расстоянием редактирования, меньше чем или равным 1.

words = ["test" "analytic" "analyze"];
maxDist = 1;
idx = rangesearch(eds,words,maxDist)
idx=3×1 cell array
    {[       4]}
    {[       5]}
    {1x0 double}

Для "analyze", нет никаких слов в искателе в заданной области. Для "test" и "analytic", существует один результат каждый. Просмотрите соответствующее слово для "test" использование возвращенного индекса.

nearestWords = eds.Vocabulary(idx{2})
nearestWords = 
"analytics"

Найдите самые близкие слова к "test", "analytic", и "analyze" с расстоянием редактирования, меньше чем или равным 3 и их соответствующими расстояниями редактирования.

words = ["test" "analytic" "analyze"];
maxDist = 3;
[idx,d] = rangesearch(eds,words,maxDist)
idx=3×1 cell array
    {[  4]}
    {[5 6]}
    {[  6]}

d=3×1 cell array
    {[  1]}
    {[1 2]}
    {[  3]}

Для обоих "test" и "analyze", существует одно слово в искателе в заданной области. Для "analytic", существует два результата. Просмотрите соответствующие слова для "analytic" (второе слово) использование возвращенных индексов и их расстояний редактирования.

i = 2;
nearestWords = eds.Vocabulary(idx{i})
nearestWords = 1x2 string
    "analytics"    "analysis"

d{i}
ans = 1×2

     1     2

Алгоритмы

развернуть все

Введенный в R2019a