Класс FeatureSeliceNCARexression

Выбор элемента для регрессии с использованием анализа компонентов окрестности (NCA)

Описание

FeatureSelectionNCARegression содержит данные, информацию о подгонке, веса элементов и другие параметры модели для модели анализа компонентов окрестности (NCA). fsrnca изучает веса функций с помощью диагональной адаптации NCA и возвращает экземпляр FeatureSelectionNCARegression объект. Функция обеспечивает выбор элемента путем упорядочения весов элемента.

Строительство

Создать FeatureSelectionNCAClassification объект с использованием fsrnca.

Свойства

развернуть все

`NumObservations` - Количество наблюдений в данных обучения
скаляр

Количество наблюдений в данных обучения (X и Y) после удаления NaN или Inf значения, хранящиеся как скаляр.

Типы данных: double

`ModelParameters` - Параметры модели
структура

Параметры модели, используемые для обучения модели, хранящиеся в виде структуры.

Вы можете получить доступ к полям ModelParameters с использованием точечной нотации.

Например, для объекта FeatureSeliceNCARexression с именем mdl, вы можете получить доступ к LossFunction значение с использованием mdl.ModelParameters.LossFunction.

Типы данных: struct

`Lambda` - Параметр регуляризации
скаляр

Параметр регуляризации, используемый для обучения этой модели, хранится как скаляр. Для n наблюдений лучшее Lambda ожидается, что значение, которое минимизирует ошибку обобщения модели NCA, будет кратным 1/n.

Типы данных: double

`FitMethod` - имя метода подгонки, используемого для подгонки этой модели;
`'exact'` | `'none'` | `'average'`

Имя метода подгонки, используемого для подгонки этой модели, сохраненное как одно из следующих:

'exact' - Выполнить фитинг с использованием всех данных.
'none' - Без подгонки. Эта опция используется для оценки ошибки обобщения модели NCA с использованием начальных весов функций, предоставленных в вызове fsrnca.
'average' - Программное обеспечение делит данные на разделы (подмножества), подгоняет каждый раздел с помощью exact и возвращает среднее значение весов элемента. Можно указать количество разделов с помощью NumPartitions аргумент пары имя-значение.

`Solver` - имя решателя, используемого для соответствия этой модели;
`'lbfgs'` | `'sgd'` | `'minibatch-lbfgs'`

Имя решателя, используемого для соответствия этой модели, сохраненное как одно из следующих:

'lbfgs' - Алгоритм Бройдена-Флетчера-Гольдфарба-Шанно (LBFGS) с ограниченной памятью
'sgd' - Алгоритм стохастического градиентного спуска (SGD)
'minibatch-lbfgs' - стохастический градиентный спуск с алгоритмом LBFGS, применяемым к мини-партиям

`GradientTolerance` - Относительный допуск сходимости для градиентной нормы
положительный скаляр

Относительный допуск сходимости для градиентной нормы 'lbfgs' и 'minibatch-lbfgs' решатели, хранящиеся как положительное скалярное значение.

Типы данных: double

`IterationLimit` - Максимальное количество итераций для оптимизации
положительное целое число

Максимальное количество итераций для оптимизации, сохраненных как положительное целое значение.

Типы данных: double

`PassLimit` - Максимальное количество проходов
положительное целое число

Максимальное количество проходов для 'sgd' и 'minibatch-lbfgs' решатели. Каждый проход обрабатывает все наблюдения в данных.

Типы данных: double

`InitialLearningRate` - Коэффициент начального обучения
положительный действительный скаляр

Коэффициент начального обучения для 'sgd' и 'minibatch-lbfgs' решатели. Скорость обучения затухает над итерациями, начиная со значения, указанного для InitialLearningRate.

Используйте NumTuningIterations и TuningSubsetSize для управления автоматической настройкой начальной скорости обучения в вызове fsrnca.

Типы данных: double

`Verbose` - Индикатор уровня детализации
неотрицательное целое число

Индикатор уровня детализации, хранящийся как неотрицательное целое число. Возможные значения:

0 - Сводка сходимости отсутствует
1 - Сводка сходимости, включая норму градиента и значение целевой функции
> 1 - Дополнительная информация о сходимости в зависимости от алгоритма подгонки. При использовании 'minibatch-lbfgs' решатель и уровень детализации > 1, информация о сходимости включает в себя журнал итераций из промежуточной мини-таблицы LBFGS.

Типы данных: double

`InitialFeatureWeights` - Начальные веса элементов
вектор p-by-1 положительных вещественных скаляров

Начальные веса признаков, хранящиеся в виде вектора p-by-1 положительных вещественных скаляров, где p - число предикторов в X.

Типы данных: double

`FeatureWeights` - Вес элементов
Вектор p-by-1 вещественных скалярных значений

Веса признаков, хранящиеся как вектор p-by-1 вещественных скалярных значений, где p - число предикторов в X.

Для 'FitMethod' равно 'average', FeatureWeights является матрицей p-by-m, где m - количество разбиений, указанных через 'NumPartitions' аргумент пары имя-значение в вызове fsrnca.

Абсолютное значение FeatureWeights(k) является мерой важности предиктора k. Если FeatureWeights(k) близок к 0, то это указывает на то, что предиктор k не влияет на ответ в Y.

Типы данных: double

`FitInfo` - Информация о соответствии
структура

Информация о соответствии, хранящаяся в виде структуры со следующими полями.

Имя поля	Значение
`Iteration`	Индекс итерации
`Objective`	Регуляризованная целевая функция для минимизации
`UnregularizedObjective`	Нерегулируемая целевая функция для минимизации
`Gradient`	Градиент регуляризованной целевой функции для минимизации

Для классификации, UnregularizedObjective представляет собой отрицательное значение точности отказа от использования классификатора NCA в данных обучения.
Для регрессии UnregularizedObjective представляет единоразовую потерю между истинным ответом и прогнозируемым ответом при использовании регрессионной модели NCA.
Для 'lbfgs' решатель, Gradient - конечный градиент. Для 'sgd' и 'minibatch-lbfgs' решатели, Gradient - окончательный градиент мини-партии.
Если FitMethod является 'average', то FitInfo является массивом структуры m-by-1, где m - количество разделов, указанных через 'NumPartitions' аргумент пары имя-значение.

Вы можете получить доступ к полям FitInfo с использованием точечной нотации. Например, для объекта FeatureSeliceNCARegressionobject с именем mdl, вы можете получить доступ к Objective использование поля mdl.FitInfo.Objective.

Типы данных: struct

`Mu` - Предиктор означает
вектор p-by-1 | `[]`

Предикторные средства, хранящиеся в виде вектора p-by-1 для стандартизированных тренировочных данных. В этом случае predict метод центрирует матрицу предиктора X путем вычитания соответствующего элемента Mu из каждого столбца.

Если данные не стандартизированы во время обучения, то Mu пуст.

Типы данных: double

`Sigma` - Предикторные стандартные отклонения
вектор p-by-1 | `[]`

Стандартные отклонения предиктора, хранящиеся в виде вектора p-by-1 для стандартизированных тренировочных данных. В этом случае predict метод масштабирует матрицу предиктора X делением каждого столбца на соответствующий элемент Sigma после центрирования данных с помощью Mu.

Если данные не стандартизированы во время обучения, то Sigma пуст.

Типы данных: double

`X` - Предикторные значения
Матрица n-by-p

Предикторные значения, используемые для обучения этой модели, хранятся в виде матрицы n-by-p. n - количество наблюдений, а p - число предикторных переменных в данных обучения.

Типы данных: double

`Y` - Значения ответа
числовой вектор размера n

Значения ответа, используемые для обучения этой модели, хранятся в виде числового вектора размера n, где n - количество наблюдений.

Типы данных: double

`W` - Наблюдательные веса
числовой вектор размера n

Веса наблюдения, используемые для обучения этой модели, хранятся в виде числового вектора размера N. Сумма весов наблюдения равна n.

Типы данных: double

Методы

потеря	Оценка точности усвоенных весов характеристик на тестовых данных
предсказать	Прогнозирование ответов с использованием регрессионной модели анализа компонентов соседства (NCA)
ремонт	Модель анализа соседства (NCA) для регрессии

Примеры

свернуть все

Исследовать `FeatureSelectionNCARegression` Объект

Открыть сценарий в реальном времени

Загрузите образцы данных.

load imports-85

Первые 15 столбцов содержат непрерывные переменные предиктора, в то время как 16-й столбец содержит переменную отклика, которая является ценой автомобиля. Определите переменные для модели анализа компонентов окрестности.

Predictors = X(:,1:15);
Y = X(:,16);

Подгонка модели анализа компонентов окрестности (NCA) для регрессии для обнаружения соответствующих элементов.

mdl = fsrnca(Predictors,Y);

Возвращенная модель NCA, mdl, является FeatureSelectionNCARegression объект. В этом объекте хранится информация о данных обучения, модели и оптимизации. Доступ к свойствам объекта, таким как веса элементов, можно получить с помощью точечной нотации.

Постройте график весов элементов.

figure()
plot(mdl.FeatureWeights,'ro')
xlabel('Feature Index')
ylabel('Feature Weight')
grid on

Figure contains an axes. The axes contains an object of type line.

Веса неактуальных элементов равны нулю. 'Verbose',1 опция в вызове fsrnca отображает информацию об оптимизации в командной строке. Можно также визуализировать процесс оптимизации путем отображения целевой функции в сравнении с номером итерации.

figure()
plot(mdl.FitInfo.Iteration,mdl.FitInfo.Objective,'ro-')
grid on
xlabel('Iteration Number')
ylabel('Objective')

Figure contains an axes. The axes contains an object of type line.

ModelParameters свойство является struct содержит дополнительную информацию о модели. Доступ к полям этого свойства можно получить с помощью точечной нотации. Например, проверьте, были ли данные стандартизированы или нет.

mdl.ModelParameters.Standardize

ans = logical
   0

0 означает, что данные не были стандартизированы до установки модели NCA. Вы можете стандартизировать предикторы, когда они находятся в очень разных масштабах, используя 'Standardize',1 аргумент пары имя-значение в вызове fsrnca .

Копирование семантики

Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.

См. также

fsrnca | loss | predict | refit

Темы

Представлен в R2016b

Документация

Класс FeatureSeliceNCARexression

Описание

Строительство

Свойства

`NumObservations` - Количество наблюдений в данных обучения
скаляр

`ModelParameters` - Параметры модели
структура

`Lambda` - Параметр регуляризации
скаляр

`FitMethod` - имя метода подгонки, используемого для подгонки этой модели;
`'exact'` | `'none'` | `'average'`

`Solver` - имя решателя, используемого для соответствия этой модели;
`'lbfgs'` | `'sgd'` | `'minibatch-lbfgs'`

`GradientTolerance` - Относительный допуск сходимости для градиентной нормы
положительный скаляр

`IterationLimit` - Максимальное количество итераций для оптимизации
положительное целое число

`PassLimit` - Максимальное количество проходов
положительное целое число

`InitialLearningRate` - Коэффициент начального обучения
положительный действительный скаляр

`Verbose` - Индикатор уровня детализации
неотрицательное целое число

`InitialFeatureWeights` - Начальные веса элементов
вектор p-by-1 положительных вещественных скаляров

`FeatureWeights` - Вес элементов
Вектор p-by-1 вещественных скалярных значений

`FitInfo` - Информация о соответствии
структура

`Mu` - Предиктор означает
вектор p-by-1 | `[]`

`Sigma` - Предикторные стандартные отклонения
вектор p-by-1 | `[]`

`X` - Предикторные значения
Матрица n-by-p

`Y` - Значения ответа
числовой вектор размера n

`W` - Наблюдательные веса
числовой вектор размера n

Методы

Примеры

Исследовать `FeatureSelectionNCARegression` Объект

Копирование семантики

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

Документация

Класс FeatureSeliceNCARexression

Описание

Строительство

Свойства

NumObservations - Количество наблюдений в данных обучения скаляр

ModelParameters - Параметры модели структура

Lambda - Параметр регуляризации скаляр

FitMethod - имя метода подгонки, используемого для подгонки этой модели; 'exact' | 'none' | 'average'

Solver - имя решателя, используемого для соответствия этой модели; 'lbfgs' | 'sgd' | 'minibatch-lbfgs'

GradientTolerance - Относительный допуск сходимости для градиентной нормы положительный скаляр

IterationLimit - Максимальное количество итераций для оптимизации положительное целое число

PassLimit - Максимальное количество проходов положительное целое число

InitialLearningRate - Коэффициент начального обучения положительный действительный скаляр

Verbose - Индикатор уровня детализации неотрицательное целое число

InitialFeatureWeights - Начальные веса элементов вектор p-by-1 положительных вещественных скаляров

FeatureWeights - Вес элементов Вектор p-by-1 вещественных скалярных значений

FitInfo - Информация о соответствии структура

Mu - Предиктор означает вектор p-by-1 | []

Sigma - Предикторные стандартные отклонения вектор p-by-1 | []

X - Предикторные значения Матрица n-by-p

Y - Значения ответа числовой вектор размера n

W - Наблюдательные веса числовой вектор размера n

Методы

Примеры

Исследовать FeatureSelectionNCARegression Объект

Копирование семантики

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

`NumObservations` - Количество наблюдений в данных обучения
скаляр

`ModelParameters` - Параметры модели
структура

`Lambda` - Параметр регуляризации
скаляр

`FitMethod` - имя метода подгонки, используемого для подгонки этой модели;
`'exact'` | `'none'` | `'average'`

`Solver` - имя решателя, используемого для соответствия этой модели;
`'lbfgs'` | `'sgd'` | `'minibatch-lbfgs'`

`GradientTolerance` - Относительный допуск сходимости для градиентной нормы
положительный скаляр

`IterationLimit` - Максимальное количество итераций для оптимизации
положительное целое число

`PassLimit` - Максимальное количество проходов
положительное целое число

`InitialLearningRate` - Коэффициент начального обучения
положительный действительный скаляр

`Verbose` - Индикатор уровня детализации
неотрицательное целое число

`InitialFeatureWeights` - Начальные веса элементов
вектор p-by-1 положительных вещественных скаляров

`FeatureWeights` - Вес элементов
Вектор p-by-1 вещественных скалярных значений

`FitInfo` - Информация о соответствии
структура

`Mu` - Предиктор означает
вектор p-by-1 | `[]`

`Sigma` - Предикторные стандартные отклонения
вектор p-by-1 | `[]`

`X` - Предикторные значения
Матрица n-by-p

`Y` - Значения ответа
числовой вектор размера n

`W` - Наблюдательные веса
числовой вектор размера n

Исследовать `FeatureSelectionNCARegression` Объект