Самый близкий соседний поиск определяет местоположение соседей k-nearest или всех соседей на заданном расстоянии, чтобы запросить точки данных, на основе заданной метрики расстояния. Доступные метрики расстояния включают Евклидов, Хэмминг и Мэхаланобис, среди других.
Statistics and Machine Learning Toolbox™ предлагает два способа найти самых близких соседей. Можно создать объект искателя с обучающим набором данных, и передать объект и запросить наборы данных к объектным функциям (knnsearch
и rangesearch
). Или, можно использовать knnsearch
и функции rangesearch
, которые берут и обучающий набор данных и набор данных запроса непосредственно. Создание объекта искателя предпочтительно, когда у вас есть несколько наборов данных запроса потому что информация об объектно-ориентированной памяти искателя, характерная для наборов данных. Например, KDTreeSearcher
объектно-ориентированная память Kd-дерево.
Классификация Используя самых близких соседей
Категоризируйте точки данных на основе их расстояния до точек в обучающем наборе данных, с помощью множества метрик расстояния.