Поиск ближайшего соседа определяет местоположение k-ближайших соседей или всех соседей в пределах заданного расстояния для запроса точек данных на основе заданной метрики расстояния. Доступные метрики расстояния включают, среди прочего, евклидово, хаммингово и махаланобисское.
Toolbox™ статистики и машинного обучения предлагает два способа поиска ближайших соседей. Можно создать объект поиска с набором учебных данных и передать наборы данных объекта и запроса функциям объекта (knnsearch и rangesearch). Или вы можете использовать knnsearch и rangesearch функции, которые принимают как набор обучающих данных, так и непосредственно набор данных запроса. Создание объекта поиска является предпочтительным при наличии нескольких наборов данных запроса, поскольку объект поиска хранит информацию, общую для наборов данных. Например, KDTreeSearcher объект сохраняет Kd-дерево.
Классификация с использованием ближайших соседей
Категоризация точек данных на основе их расстояния до точек в обучающем наборе данных с использованием различных метрик расстояния.