FeatureSelectionNCAClassification class

Выбор признаков для классификации с помощью анализа компонента окружения (NCA)

Описание

FeatureSelectionNCAClassification объект содержит данные, подходящую информацию, веса функции и другие параметры модели анализа компонента окружения (NCA). fscnca изучает веса функции с помощью диагональной адаптации NCA и возвращает экземпляр FeatureSelectionNCAClassification объект. Функция достигает выбора признаков путем упорядочивания весов функции.

Конструкция

Создайте FeatureSelectionNCAClassification объект с помощью fscnca.

Свойства

развернуть все

`NumObservations` — Количество наблюдений в обучающих данных
скаляр

Количество наблюдений в обучающих данных (X и Y) после удаления NaN или Inf значения, сохраненные как скаляр.

Типы данных: double

`ModelParameters` — Параметры модели
структура

Параметры модели использовали в обучении модель, сохраненную как структура.

Можно получить доступ к полям ModelParameters использование записи через точку.

Например, для объекта FeatureSelectionNCAClassification под названием mdl, можно получить доступ к LossFunction значение с помощью mdl.ModelParameters.LossFunction.

Типы данных: struct

`Lambda` — Параметр регуляризации
скаляр

Параметр регуляризации использовал в обучении эту модель, сохраненную как скаляр. Для наблюдений n, лучшего Lambda значение, которое минимизирует ошибку обобщения модели NCA, как ожидают, будет кратным 1/n.

Типы данных: double

`FitMethod` — Имя подходящего метода
`'exact'` | `'none'` | `'average'`

Имя подходящего метода раньше подбирало эту модель, сохраненную как одно из следующего:

'exact' — Выполните подбор кривой с помощью всех данных.
'none' — Никакой подбор кривой. Используйте эту опцию, чтобы оценить ошибку обобщения модели NCA с помощью начальных весов функции, предоставленных в вызове fscnca.
'average' — Разделите данные на разделы (подмножества), соответствуйте каждому разделу с помощью exact метод, и возвращает среднее значение весов функции. Можно задать количество разделов с помощью NumPartitions аргумент пары "имя-значение".

`Solver` — Имя решателя раньше подбирало эту модель
`'lbfgs'` | `'sgd'` | `'minibatch-lbfgs'`

Имя решателя раньше подбирало эту модель, сохраненную как одно из следующего:

'lbfgs' — Ограниченная память Бройден Флетчер Голдфарб Шэнно (LBFGS) алгоритм
'sgd' — Алгоритм стохастического градиентного спуска (SGD)
'minibatch-lbfgs' — стохастический градиентный спуск с алгоритмом LBFGS применился к мини-пакетам

`GradientTolerance` — Относительный допуск сходимости на норме градиента
положительная скалярная величина

Относительный допуск сходимости на норме градиента для 'lbfgs' и 'minibatch-lbfgs' решатели, сохраненные как значение положительной скалярной величины.

Типы данных: double

`IterationLimit` — Максимальное количество итераций для оптимизации
положительное целое число

Максимальное количество итераций для оптимизации, сохраненной как положительное целочисленное значение.

Типы данных: double

`PassLimit` — Максимальное количество передач
положительное целое число

Максимальное количество передач для 'sgd' и 'minibatch-lbfgs' решатели. Каждая передача процессы все наблюдения в данных.

Типы данных: double

`InitialLearningRate` — Начальный темп обучения
положительный действительный скаляр

Начальный темп обучения для 'sgd' и 'minibatch-lbfgs' решатели, сохраненные как положительный действительный скаляр. Темп обучения затухает по итерациям, запускающимся в значении, заданном для InitialLearningRate.

Используйте NumTuningIterations и TuningSubsetSize аргументы пары "имя-значение", чтобы управлять автоматической настройкой начального темпа обучения в вызове fscnca.

Типы данных: double

`Verbose` — Индикатор уровня многословия
неотрицательное целое число

Индикатор уровня многословия, сохраненный как неотрицательное целое число. Возможные значения:

0 — Никакие сводные данные сходимости
1 — сводные данные Сходимости, включая норму градиента и значения целевой функции
> 1 — Больше информации о сходимости, в зависимости от алгоритма подбора. Когда вы используете 'minibatch-lbfgs' решатель и уровень многословия> 1, информация о сходимости включает журнал итерации от промежуточных мини-пакетных подгонок LBFGS.

Типы данных: double

`InitialFeatureWeights` — Начальные веса функции
p-by-1 вектор положительных действительных скаляров

Начальные веса функции, сохраненные как p-by-1 вектор положительных действительных скаляров, где p является количеством предикторов в X.

Типы данных: double

`FeatureWeights` — Покажите веса
p-by-1 вектор действительных скаляров

Покажите веса, сохраненные как p-by-1 вектор действительных скаляров, где p является количеством предикторов в X.

Если FitMethod 'average', затем FeatureWeights p-by-m матрица. m является количеством разделов, заданных через 'NumPartitions' аргумент пары "имя-значение" в вызове fscnca.

Абсолютное значение FeatureWeights(k) мера важности предиктора k. FeatureWeights(k) значение, которое является близко к 0, указывает на тот предиктор k не влияет на ответ в Y.

Типы данных: double

`FitInfo` — Подходящая информация
структура

Подходящая информация, хранившая как структура со следующими полями.

Имя поля	Значение
`Iteration`	Индекс итерации
`Objective`	Упорядоченная целевая функция для минимизации
`UnregularizedObjective`	Неупорядоченная целевая функция для минимизации
`Gradient`	Градиент упорядоченной целевой функции для минимизации

Для классификации, UnregularizedObjective представляет отрицание точности, "пропускают один" классификатора NCA на обучающих данных.
Для регрессии, UnregularizedObjective представляет потерю, "пропускают один" между истинным ответом и предсказанным ответом при использовании модели регрессии NCA.
Для 'lbfgs' решатель, Gradient итоговый градиент. Для 'sgd' и 'minibatch-lbfgs' решатели, Gradient итоговый мини-пакетный градиент.
Если FitMethod 'average', затем FitInfo m-by-1 массив структур, где m является количеством разделов, заданных через 'NumPartitions' аргумент пары "имя-значение".

Можно получить доступ к полям FitInfo использование записи через точку. Например, для FeatureSelectionNCAClassificationobject назвал mdl, можно получить доступ к Objective поле с помощью mdl.FitInfo.Objective.

Типы данных: struct

`Mu` — Средние значения предиктора
p-by-1 вектор | `[]`

Средние значения предиктора, сохраненные как p-by-1 вектор для стандартизированных обучающих данных. В этом случае, predict метод сосредотачивает матрицу предиктора X путем вычитания соответствующего элемента Mu из каждого столбца.

Если данные не стандартизированы во время обучения, то Mu isempty.

Типы данных: double

`Sigma` — Стандартные отклонения предиктора
p-by-1 вектор | `[]`

Стандартные отклонения предиктора, сохраненные как p-by-1 вектор для стандартизированных обучающих данных. В этом случае, predict метод масштабирует матрицу предиктора X путем деления каждого столбца на соответствующий элемент Sigma после центрирования данных с помощью Mu.

Если данные не стандартизированы во время обучения, то Sigma isempty.

Типы данных: double

`X` — Значения предиктора
n-by-p матрица

Значения предиктора раньше обучали эту модель, сохраненную как n-by-p матрица. n является количеством наблюдений, и p является количеством переменных предикторов в обучающих данных.

Типы данных: double

`Y` — Значения ответа
числовой вектор размера n

Значения ответа раньше обучали эту модель, сохраненную как числовой вектор размера n, где n является количеством наблюдений.

Типы данных: double

`W` — Веса наблюдения
числовой вектор размера n

Веса наблюдения раньше обучали эту модель, сохраненную как числовой вектор размера n. Суммой весов наблюдения является n.

Типы данных: double

Методы

потеря	Оцените точность изученных весов функции на тестовых данных
предсказать	Предскажите ответы с помощью классификатора анализа компонента окружения (NCA)
ремонт	Переоборудуйте модель анализа компонента окружения (NCA) для классификации

Примеры

свернуть все

Исследуйте `FeatureSelectionNCAClassification` Объект

Скрипт Open Live Script

Загрузите выборочные данные.

load ionosphere

Набор данных имеет 34 непрерывных предиктора. Переменная отклика является радаром, возвращается, помеченный как b (плохо) или (хороший) g.

Подбирайте модель анализа компонента окружения (NCA) для классификации, чтобы обнаружить соответствующие функции.

mdl = fscnca(X,Y);

Возвращенная модель NCA, mdl, FeatureSelectionNCAClassification объект. Эта информация об объектно-ориентированной памяти об обучающих данных, модели и оптимизации. Можно получить доступ к свойствам объектов, таким как веса функции, с помощью записи через точку.

Постройте веса функции.

figure()
plot(mdl.FeatureWeights,'ro')
xlabel('Feature Index')
ylabel('Feature Weight')
grid on

Веса несоответствующих функций являются нулем. 'Verbose',1 опция в вызове fscnca отображает информацию об оптимизации о командной строке. Можно также визуализировать процесс оптимизации путем графического вывода целевой функции по сравнению с номером итерации.

figure
plot(mdl.FitInfo.Iteration,mdl.FitInfo.Objective,'ro-')
grid on
xlabel('Iteration Number')
ylabel('Objective')

ModelParameters свойством является struct это содержит больше информации о модели. Можно получить доступ к полям этого свойства с помощью записи через точку. Например, смотрите, были ли данные стандартизированы или нет.

mdl.ModelParameters.Standardize

ans = logical
   0

0 средние значения, что данные не были стандартизированы прежде, чем подбирать модель NCA. Можно стандартизировать предикторы, когда они находятся по совсем другим шкалам с помощью 'Standardize',1 аргумент пары "имя-значение" в вызове fscnca .

Копировать семантику

Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов (MATLAB).

Смотрите также

fscnca | loss | predict | refit

Темы

Атрибуты класса (MATLAB)
Атрибуты свойств (MATLAB)

Документация

FeatureSelectionNCAClassification class

Описание

Конструкция

Свойства

`NumObservations` — Количество наблюдений в обучающих данных
скаляр

`ModelParameters` — Параметры модели
структура

`Lambda` — Параметр регуляризации
скаляр

`FitMethod` — Имя подходящего метода
`'exact'` | `'none'` | `'average'`

`Solver` — Имя решателя раньше подбирало эту модель
`'lbfgs'` | `'sgd'` | `'minibatch-lbfgs'`

`GradientTolerance` — Относительный допуск сходимости на норме градиента
положительная скалярная величина

`IterationLimit` — Максимальное количество итераций для оптимизации
положительное целое число

`PassLimit` — Максимальное количество передач
положительное целое число

`InitialLearningRate` — Начальный темп обучения
положительный действительный скаляр

`Verbose` — Индикатор уровня многословия
неотрицательное целое число

`InitialFeatureWeights` — Начальные веса функции
p-by-1 вектор положительных действительных скаляров

`FeatureWeights` — Покажите веса
p-by-1 вектор действительных скаляров

`FitInfo` — Подходящая информация
структура

`Mu` — Средние значения предиктора
p-by-1 вектор | `[]`

`Sigma` — Стандартные отклонения предиктора
p-by-1 вектор | `[]`

`X` — Значения предиктора
n-by-p матрица

`Y` — Значения ответа
числовой вектор размера n

`W` — Веса наблюдения
числовой вектор размера n

Методы

Примеры

Исследуйте `FeatureSelectionNCAClassification` Объект

Копировать семантику

Смотрите также

Темы

Введенный в R2017b

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

FeatureSelectionNCAClassification class

Описание

Конструкция

Свойства

NumObservations — Количество наблюдений в обучающих данных скаляр

ModelParameters — Параметры модели структура

Lambda — Параметр регуляризации скаляр

FitMethod — Имя подходящего метода 'exact' | 'none' | 'average'

Solver — Имя решателя раньше подбирало эту модель 'lbfgs' | 'sgd' | 'minibatch-lbfgs'

GradientTolerance — Относительный допуск сходимости на норме градиента положительная скалярная величина

IterationLimit — Максимальное количество итераций для оптимизации положительное целое число

PassLimit — Максимальное количество передач положительное целое число

InitialLearningRate — Начальный темп обучения положительный действительный скаляр

Verbose — Индикатор уровня многословия неотрицательное целое число

InitialFeatureWeights — Начальные веса функции p-by-1 вектор положительных действительных скаляров

FeatureWeights — Покажите веса p-by-1 вектор действительных скаляров

FitInfo — Подходящая информация структура

Mu — Средние значения предиктора p-by-1 вектор | []

Sigma — Стандартные отклонения предиктора p-by-1 вектор | []

X — Значения предиктора n-by-p матрица

Y — Значения ответа числовой вектор размера n

W — Веса наблюдения числовой вектор размера n

Методы

Примеры

Исследуйте FeatureSelectionNCAClassification Объект

Копировать семантику

Смотрите также

Темы

Введенный в R2017b

Документация Statistics and Machine Learning Toolbox

Поддержка

`NumObservations` — Количество наблюдений в обучающих данных
скаляр

`ModelParameters` — Параметры модели
структура

`Lambda` — Параметр регуляризации
скаляр

`FitMethod` — Имя подходящего метода
`'exact'` | `'none'` | `'average'`

`Solver` — Имя решателя раньше подбирало эту модель
`'lbfgs'` | `'sgd'` | `'minibatch-lbfgs'`

`GradientTolerance` — Относительный допуск сходимости на норме градиента
положительная скалярная величина

`IterationLimit` — Максимальное количество итераций для оптимизации
положительное целое число

`PassLimit` — Максимальное количество передач
положительное целое число

`InitialLearningRate` — Начальный темп обучения
положительный действительный скаляр

`Verbose` — Индикатор уровня многословия
неотрицательное целое число

`InitialFeatureWeights` — Начальные веса функции
p-by-1 вектор положительных действительных скаляров

`FeatureWeights` — Покажите веса
p-by-1 вектор действительных скаляров

`FitInfo` — Подходящая информация
структура

`Mu` — Средние значения предиктора
p-by-1 вектор | `[]`

`Sigma` — Стандартные отклонения предиктора
p-by-1 вектор | `[]`

`X` — Значения предиктора
n-by-p матрица

`Y` — Значения ответа
числовой вектор размера n

`W` — Веса наблюдения
числовой вектор размера n

Исследуйте `FeatureSelectionNCAClassification` Объект