Поиск по ближайшему соседу определяет местоположение ближайших соседей или всех соседей на заданном расстоянии, чтобы запросить точки данных на основе заданной метрики расстояния. Доступные метрики расстояния включают Евклида, Хемминга и Махаланобиса, среди прочих.
Statistics and Machine Learning Toolbox™ предлагает два способа найти ближайших соседей. Можно создать объект-поисковик с обучающими данными набором и передать наборы данных объекта и запросов в функции объекта (knnsearch
и rangesearch
). Или можно использовать knnsearch
и rangesearch
функций, которые берут и набор обучающих данных, и набор данных запроса непосредственно. Создание объекта поиска является предпочтительным, когда у вас есть несколько наборов данных запроса, потому что объект поиска хранит информацию, общую для наборов данных. Для примера, a KDTreeSearcher
объект хранит Kd-дерево.
Классификация с использованием ближайших соседей
Классифицируйте точки данных на основе их расстояния до точек в наборе обучающих данных, используя различные метрики расстояния.