Оцените важность предикторов, использующих алгоритм ReliefF или RReliefF
[ ранжирует предикторы с помощью алгоритма ReliefF или ReliefF с idx,weights] = relieff(X,y,k)k ближайшие соседи. Матрица входа X содержит переменные предиктора и вектор y содержит вектор отклика. Функция возвращается idx, который содержит индексы наиболее важных предикторов, и weights, который содержит веса предикторов.
Если y является числовым, relieff выполняет анализ RReliefF для регрессии по умолчанию. В противном случае, relieff выполняет анализ Relief для классификации с помощью k ближайшие соседи по классам. Для получения дополнительной информации о ReliefF и RReliefF, см. Алгоритмы.
Ранги и веса предикторов обычно зависят от k. Если вы задаете k к 1, тогда оценки могут быть ненадежными для зашумленных данных. Если вы задаете k к значению, сопоставимому с количеством наблюдений (строк) в X, relieff может не найти важные предикторы. Вы можете начать с k = 10 и исследовать стабильность и надежность relieff рангов и веса для различных значений k.
relieff удаляет наблюдения с помощью NaN значения.
[1] Кононенко, И., Э. Симек, и М. Робник-Сиконья. (1997). Преодоление близорукости алгоритмов индуктивного обучения с помощью RELEFF. Получено из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.56.4740
[2] Робник-Сиконья, М., и И. Кононенко. (1997). «Адаптация Рельефа для оценки атрибутов в регрессии». Получено из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.34.8381
[3] Робник-Сиконья, М., и И. Кононенко. (2003). Теоретический и эмпирический анализ ReliefF и RReliefF. Машинное обучение, 53, 23-69.
fscmrmr | fscnca | fsrnca | fsulaplacian | knnsearch | pdist2 | plotPartialDependence | sequentialfs