Оцените важность предикторов, использующих алгоритм ReliefF или RReliefF
[
ранжирует предикторы с помощью алгоритма ReliefF или ReliefF с idx
,weights
] = relieff(X
,y
,k
)k
ближайшие соседи. Матрица входа X
содержит переменные предиктора и вектор y
содержит вектор отклика. Функция возвращается idx
, который содержит индексы наиболее важных предикторов, и weights
, который содержит веса предикторов.
Если y
является числовым, relieff
выполняет анализ RReliefF для регрессии по умолчанию. В противном случае, relieff
выполняет анализ Relief для классификации с помощью k
ближайшие соседи по классам. Для получения дополнительной информации о ReliefF и RReliefF, см. Алгоритмы.
Ранги и веса предикторов обычно зависят от k
. Если вы задаете k
к 1, тогда оценки могут быть ненадежными для зашумленных данных. Если вы задаете k
к значению, сопоставимому с количеством наблюдений (строк) в X
, relieff
может не найти важные предикторы. Вы можете начать с k
= 10
и исследовать стабильность и надежность relieff
рангов и веса для различных значений k
.
relieff
удаляет наблюдения с помощью NaN
значения.
[1] Кононенко, И., Э. Симек, и М. Робник-Сиконья. (1997). Преодоление близорукости алгоритмов индуктивного обучения с помощью RELEFF. Получено из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.56.4740
[2] Робник-Сиконья, М., и И. Кононенко. (1997). «Адаптация Рельефа для оценки атрибутов в регрессии». Получено из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.34.8381
[3] Робник-Сиконья, М., и И. Кононенко. (2003). Теоретический и эмпирический анализ ReliefF и RReliefF. Машинное обучение, 53, 23-69.
fscmrmr
| fscnca
| fsrnca
| fsulaplacian
| knnsearch
| pdist2
| plotPartialDependence
| sequentialfs