Оцените важность использования предикторов алгоритм RReliefF или ReliefF
[
предикторы рангов с помощью или алгоритма ReliefF или RReliefF с idx
,weights
] = relieff(X
,y
,k
)k
самые близкие соседи. Входная матрица X
содержит переменные предикторы и векторный y
содержит вектор отклика. Функция возвращает idx
, который содержит индексы самых важных предикторов и weights
, который содержит веса предикторов.
Если y
является числовым, relieff
выполняет анализ RReliefF для регрессии по умолчанию. В противном случае, relieff
выполняет анализ ReliefF для классификации с помощью k
самые близкие соседи в классе. Для получения дополнительной информации о ReliefF и RReliefF, см. Алгоритмы.
Ранги предиктора и веса обычно зависят от k
. Если вы устанавливаете k
к 1, затем оценки могут быть ненадежными для зашумленных данных. Если вы устанавливаете k
к значению, сопоставимому с количеством наблюдений (строки) в X
, relieff
может не найти важные предикторы. Можно запустить с k
= 10 и исследуйте устойчивость и надежность
relieff
ранги и веса для различных значений k
.
relieff
удаляет наблюдения с NaN
значения.
[1] Кононенко, я., Э. Симек и М. Робник-Сиконджа. (1997). “Преодолевая близорукость индуктивных алгоритмов обучения с РЕЛИЕВЫМ”. Полученный из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.56.4740
[2] Robnik-Sikonja, M. и я. Кононенко. (1997). “Адаптация Облегчения для оценки атрибута регрессию”. Полученный из CiteSeerX: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.34.8381
[3] Robnik-Sikonja, M. и я. Кононенко. (2003). “Теоретический и эмпирический анализ ReliefF и RReliefF”. Машинное обучение, 53, 23–69.
fscmrmr
| fscnca
| fsrnca
| fsulaplacian
| knnsearch
| pdist2
| plotPartialDependence
| sequentialfs