Ранговая важность предикторов с использованием алгоритма ReliefF или RReloringF
[ ранжирует предикторы с использованием алгоритма ReliefF или RReloringF с idx,weights] = relieff(X,y,k)k ближайшие соседи. Входная матрица X содержит переменные предиктора и вектор y содержит вектор ответа. Функция возвращает idx, который содержит индексы наиболее важных предикторов, и weights, который содержит веса предикторов.
Если y числовой, relieff по умолчанию выполняет анализ RRel.F для регрессии. В противном случае relieff выполняет анализ ReliefF для классификации с использованием k ближайшие соседи на класс. Для получения дополнительной информации о ReliefF и RReliefF, см. Алгоритмы.
Ранги и веса предикторов обычно зависят от k. Если установить k 1, то оценки могут быть ненадежными для шумных данных. Если установить k до значения, сопоставимого с количеством наблюдений (строк) в X, relieff может не найти важных предикторов. Начать можно с k = 10 и исследовать стабильность и надежность relieff ранги и веса для различных значений k.
relieff удаляет наблюдения с помощью NaN значения.
[1] Кононенко, И., Э. Симец и М. Робник-Сиконя. (1997). «Преодоление близорукости алгоритмов индуктивного обучения с помощью RELIEFF». Получено из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.56.4740
[2] Робник-Сиконя, М., и И. Кононенко. (1997). «Адаптация рельефа для оценки атрибута в регрессии». Получено из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.34.8381
[3] Робник-Сиконя, М., и И. Кононенко. (2003). «Теоретический и эмпирический анализ ReliefF и RReliefF». Машинное обучение, 53, 23-69.
fscmrmr | fscnca | fsrnca | fsulaplacian | knnsearch | pdist2 | plotPartialDependence | sequentialfs