incrementalRegressionLinear

Модель линейной регрессии для инкрементного обучения

Описание

incrementalRegressionLinear создает incrementalRegressionLinear объект модели, представляющий инкрементную линейную модель для регрессионных задач. Поддерживаемые ученики включают в себя вспомогательную векторную машину (SVM) и наименьшие квадраты.

В отличие от других объектов модели Toolbox™ статистики и машинного обучения, incrementalRegressionLinear может вызываться напрямую. Кроме того, перед подгонкой модели к данным можно задать параметры обучения, такие как конфигурации показателей производительности, значения параметров и целевой решатель. После создания incrementalRegressionLinear объект подготовлен к инкрементному обучению.

incrementalRegressionLinear лучше всего подходит для инкрементного обучения. Традиционный подход к обучению модели SVM или линейной регрессии (например, создание модели путем подгонки ее к данным, выполнение перекрестной проверки, настройка гиперпараметров и т. д.) см. в разделе. fitrsvm или fitrlinear.

Создание

Можно создать incrementalRegressionLinear объект модели несколькими способами:

Вызовите функцию напрямую - настройте параметры инкрементного обучения или укажите начальные значения параметров и гиперпараметров линейной модели путем вызова incrementalRegressionLinear непосредственно. Этот подход лучше всего подходит, когда у вас еще нет данных или вы хотите немедленно начать инкрементное обучение.
Преобразовать традиционно обученную модель - чтобы инициализировать модель линейной регрессии для инкрементного обучения с использованием коэффициентов модели и гиперпараметров обучаемого объекта модели SVM или линейной регрессии, можно преобразовать традиционно обученную модель в incrementalRegressionLinear объект модели путем передачи его в incrementalLearner функция. Эта таблица содержит ссылки на соответствующие страницы ссылок.

Конвертируемый объект модели Функция преобразования
RegressionSVM или CompactRegressionSVM incrementalLearner
RegressionLinear incrementalLearner
Вызов функции инкрементного обучения - fit, updateMetrics, и updateMetricsAndFit принять сконфигурированный incrementalRegressionLinear объект модели и данные в качестве входных данных и возвращают incrementalRegressionLinear объект модели обновлен информацией, полученной из входной модели и данных.

Конвертируемый объект модели	Функция преобразования
`RegressionSVM` или `CompactRegressionSVM`	`incrementalLearner`
`RegressionLinear`	`incrementalLearner`

Синтаксис

Mdl = incrementalRegingLinear ()

Mdl = incrementalRegenedLinear (имя, значение)

Описание

пример

Mdl = incrementalRegressionLinear() возвращает объект линейной модели по умолчанию для регрессии Mdl. Свойства модели по умолчанию содержат местозаполнители для неизвестных параметров модели. Необходимо обучить модель по умолчанию, прежде чем можно будет отслеживать ее производительность или генерировать прогнозы на ее основе.

пример

Mdl = incrementalRegressionLinear(Name,Value) задает свойства и дополнительные параметры, используя аргументы пары имя-значение. Заключите каждое имя в кавычки. Например, incrementalRegressionLinear('Beta',[0.1 0.3],'Bias',1,'MetricsWarmupPeriod',100) устанавливает вектор коэффициентов линейной модели β в [0.1 0.3], смещение β0 до 1и период прогрева метрик до 100.

Входные аргументы

развернуть все

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Standardize',true стандартизирует данные предиктора с использованием средства предиктора и стандартных отклонений, оцененных в течение периода оценки.

`'Metrics'` - Модель показателей производительности для отслеживания во время инкрементного обучения
`"epsiloninsensitive"` | `"mse"` | вектор строки | дескриптор функции | вектор ячейки | массив структуры |...

Метрики производительности модели для отслеживания во время инкрементного обучения, указанные как пара, разделенная запятыми, состоящая из 'Metrics' и имя встроенной функции потери, строковый вектор имен, дескриптор функции (@metricName), структурный массив дескрипторов функций или вектор ячеек имен, дескрипторов функций или структурных массивов.

Когда Mdl теплый (см. IsThream), updateMetrics и updateMetricsAndFit отслеживать метрики производительности в свойстве Metrics Mdl.

В следующей таблице перечислены имена встроенных функций потери и учащиеся, указанные в Mdl.Learner, поддерживайте их. С помощью вектора строки можно указать несколько функций потери.

Имя	Описание	Ученики, поддерживающие метрику
`"epsiloninsensitive"`	Эпсилоновая нечувствительная потеря	`'svm'`
`"mse"`	Средневзвешенная квадратичная ошибка	`'svm'` и `'leastsquares'`

Дополнительные сведения о встроенных функциях потери см. в разделе loss.

Пример: 'Metrics',["epsiloninsensitive" "mse"]

Чтобы указать пользовательскую функцию, возвращающую метрику производительности, используйте нотацию дескриптора функции. Функция должна иметь следующую форму:

metric = customMetric(Y,YFit)

Выходной аргумент metric является n-на-1 числовым вектором, где каждый элемент является потерей соответствующего наблюдения в данных, обрабатываемых инкрементными функциями обучения в течение цикла обучения.
Выберите имя функции (customMetric).
Y - длина n числового вектора наблюдаемых ответов, где n - размер выборки.
YFit является n-числовым вектором соответствующих предсказанных откликов.

Чтобы указать несколько пользовательских метрик и назначить каждому пользовательское имя, используйте массив структуры. Чтобы задать комбинацию встроенных и пользовательских метрик, используйте вектор ячейки.

Пример: 'Metrics',struct('Metric1',@customMetric1,'Metric2',@customMetric2)

Пример: 'Metrics',{@customMetric1 @customeMetric2 'mse' struct('Metric3',@customMetric3)}

updateMetrics и updateMetricsAndFit сохранить указанные метрики в таблице в свойстве Metrics. Тип данных Metrics определяет имена строк таблицы.

`'Metrics'` Тип данных значения	Описание `Metrics` Имя строки свойства	Пример
Строковый или символьный вектор	Наименование соответствующей встроенной метрики	Имя строки для `"epsiloninsensitive"` является `"EpsilonInsensitiveLoss"`
Структурный массив	Имя поля	Имя строки для `struct('Metric1',@customMetric1)` является `"Metric1"`
Дескриптор функции для функции, сохраненной в файле программы	Наименование функции	Имя строки для `@customMetric` является `"customMetric"`
Анонимная функция	`CustomMetric_j`, где `j` является метрикой `j` в `Metrics`	Имя строки для `@(Y,YFit)customMetric(Y,YFit)...` является `CustomMetric_1`

По умолчанию:

Metrics является "epsiloninsensitive" если Mdl.Learner является 'svm'.
Metrics является "mse" если Mdl.Learner является 'leastsquares'.

Дополнительные сведения о параметрах показателей производительности см. в разделе Показатели производительности.

Типы данных: char | string | struct | cell | function_handle

`'Standardize'` - Флаг для стандартизации данных предиктора
`'auto'` (по умолчанию) | `false` | `true`

Флаг для стандартизации данных предиктора, указанный как пара, разделенная запятыми, состоящая из 'Standardize' и значение в этой таблице.

Стоимость	Описание
`'auto'`	`incrementalRegressionLinear` определяет необходимость стандартизации переменных предиктора. См. раздел Стандартизация данных.
`true`	Программное обеспечение стандартизирует данные предиктора. Дополнительные сведения см. в разделе Стандартизация данных.
`false`	Программное обеспечение не стандартизирует данные предиктора.

Пример: 'Standardize',true

Типы данных: logical | char | string

Свойства

развернуть все

Большинство свойств можно задать с помощью синтаксиса аргумента пары имя-значение только при вызове incrementalRegressionLinear. Некоторые свойства можно задать при вызове incrementalLearner преобразование традиционно обученной модели. Невозможно задать свойства FittedLoss, NumTrainingObservations, Mu, Sigma, SolverOptions , и IsWarm.

Параметры регрессионной модели

`Beta` - Коэффициенты линейной модели β
числовой вектор

Это свойство доступно только для чтения.

Коэффициенты линейной модели β, указанные как NumPredictors-по-1 числовой вектор.

При преобразовании традиционно обученной модели для создания Mdl, Beta определяется значением Beta свойство традиционно обученной модели. В противном случае по умолчанию Beta является zeros(NumPredictors,1).

Типы данных: single | double

`Bias` - Модельный перехват β0
числовой скаляр

Это свойство доступно только для чтения.

Модель перехватывает β0, или член смещения, заданный как числовой скаляр.

При преобразовании традиционно обученной модели для создания Mdl, Bias определяется значением Bias свойство традиционно обученной модели. В противном случае по умолчанию Bias является 0.

Типы данных: single | double

`Epsilon` - Половина ширины эпсилоновой нечувствительной полосы
`'auto'` | неотрицательный скаляр

Это свойство доступно только для чтения.

Половина ширины эпсилонового нечувствительного диапазона, указанного как 'auto' или неотрицательный скаляр.

При указании 'auto' при звонке incrementalRegressionLinear, оценка инкрементных фитинговых функций Epsilon в течение расчетного периода, определенного Пр, используя следующую процедуру:

Если iqr(Y) ≠ 0, Epsilon является iqr(Y)/13.49, где Y - данные ответа периода оценки.
Если iqr(Y) = 0 или до посадки Mdl к данным, Epsilon является 0.1.

При преобразовании традиционно обученной модели регрессии SVM для создания Mdl (Learner является 'svm'), Epsilon определяется значением Epsilon свойство традиционно обученной модели.

Если Learner является 'leastsquares', нельзя установить Epsilon и его значение NaN.

Типы данных: single | double

`FittedLoss` - Функция потерь, используемая для подгонки линейной модели
`'epsiloninsensitive'` | `'mse'`

Это свойство доступно только для чтения.

Функция потерь, используемая для соответствия линейной модели, заданная как 'epsiloninsensitive' или 'mse'.

Стоимость	Алгоритм	Функция потерь	`Learner` Стоимость
`'epsiloninsensitive'`	Поддержка векторной машинной регрессии	Эпсилон нечувствительный: $ℓ[y,f (x)] = max [0, \| y -$ f (x) \| −	`'svm'`
`'mse'`	Линейная регрессия через обычные наименьшие квадраты	Среднеквадратичная ошибка (MSE): $ℓ[y,f (x)] \frac{}{=} {12 [y -}^{}$ f (x)] 2	`'leastsquares'`

`Learner` - Тип модели линейной регрессии
`'leastsquares'` | `'svm'`

Это свойство доступно только для чтения.

Тип модели линейной регрессии, указанный как 'leastsquares' или 'svm'.

В следующей таблице $f (x) = xβ$ + b.

β является Beta.
x - это наблюдение из переменных p-предиктора.
β0 является Bias.

Стоимость	Алгоритм	Функция потерь	`FittedLoss` Стоимость
`'leastsquares'`	Линейная регрессия через обычные наименьшие квадраты	Среднеквадратичная ошибка (MSE): $ℓ[y,f (x)] \frac{}{=} {12 [y -}^{}$ f (x)] 2	`'mse'`
`'svm'`	Поддержка векторной машинной регрессии	Эпсилон нечувствительный: $ℓ[y,f (x)] = max [0, \| y -$ f (x) \| −	`'epsiloninsensitive'`

При преобразовании традиционно обученной модели для создания Mdl, Learner является учеником традиционно обученной модели.

Если традиционно обученная модель CompactRegressionSVM или RegressionSVM, Learner является 'svm'.
Если традиционно обученная модель RegressionLinear, Learner - значение Learner свойство традиционно обученной модели.

`NumPredictors` - Количество переменных предиктора
`0` (по умолчанию) | неотрицательный числовой скаляр

Это свойство доступно только для чтения.

Число переменных предиктора, указанных как неотрицательный числовой скаляр.

При преобразовании традиционно обученной модели для создания Mdl, NumPredictors определяется конгруэнтным свойством традиционно обученной модели. В противном случае функции приращения фитинга выводят NumPredictors из данных предиктора во время тренировки.

Типы данных: double

`NumTrainingObservations` - Количество наблюдений, соответствующих инкрементной модели
`0` (по умолчанию) | неотрицательный числовой скаляр

Это свойство доступно только для чтения.

Количество наблюдений, соответствующих инкрементной модели Mdl, указанный как неотрицательный числовой скаляр. NumTrainingObservations увеличивается при прохождении Mdl и данные обучения fit или updateMetricsAndFit.

Примечание

При преобразовании традиционно обученной модели для создания Mdl, incrementalRegressionLinear не добавляет количество наблюдений, подходящих для традиционно обученной модели, к NumTrainingObservations.

Типы данных: double

`ResponseTransform` - Функция преобразования ответа
`'none'` | дескриптор функции

Это свойство доступно только для чтения.

Функция преобразования ответа, указанная как 'none' или дескриптор функции. ResponseTransform описывает, как функции инкрементного обучения преобразуют исходные значения ответа.

Для определяемой функции MATLAB ® введите дескриптор ее функции; например ,'ResponseTransform',@function, где function принимает вектор n-by-1 (исходные отклики) и возвращает вектор той же длины (преобразованные отклики).

При преобразовании традиционно обученной модели для создания Mdl, ResponseTransform определяется конгруэнтным свойством традиционно обученной модели.
В противном случае ResponseTransform является 'none'.

Типы данных: char | function_handle

Параметры обучения

`EstimationPeriod` - Количество наблюдений, обработанных для оценки гиперпараметров
неотрицательное целое число

Это свойство доступно только для чтения.

Количество наблюдений, обработанных инкрементной моделью для оценки гиперпараметров перед обучением или отслеживанием метрик производительности, указанных как неотрицательное целое число.

Примечание

Если Mdl подготовлен к инкрементному обучению (указаны все гиперпараметры, необходимые для обучения), incrementalRegressionLinear силы 'EstimationPeriod' кому 0.
Если Mdl не подготовлен к инкрементному обучению, incrementalRegressionLinear наборы 'EstimationPeriod' кому 1000.

Дополнительные сведения см. в разделе Период оценки.

Типы данных: single | double

`FitBias` - Флаг включения пересечения линейной модели
`true` | `false`

Это свойство доступно только для чтения.

Флаг включения пересечения линейной модели, указанный как true или false.

Стоимость	Описание
`true`	`incrementalRegressionLinear` включает в линейную модель член смещения β0, какие инкрементные аппроксимирующие функции подходят к данным.
`false`	`incrementalRegressionLinear` устанавливает β0 = 0.

Если Bias ≠ 0, FitBias должно быть true. Другими словами, incrementalRegressionLinear не поддерживает ограничение равенства для β0.

При преобразовании традиционно обученной модели линейной регрессии (RegressionLinear) для создания Mdl, FitBias определяется значением ModelParameters.FitBias свойство традиционно обученной модели.

Типы данных: logical

`Mu` - Предиктор означает
вектор числовых значений | `[]`

Это свойство доступно только для чтения.

Средство предсказания, указанное как числовой вектор.

Если Mu является пустым массивом [] и вы указываете 'Standardize',true, набор инкрементных функций фитинга Mu в средство предикторной переменной, оцененное в течение периода оценки, указанного EstimationPeriod.

Невозможно указать Mu непосредственно.

Типы данных: single | double

`Sigma` - Предикторные стандартные отклонения
вектор числовых значений | `[]`

Это свойство доступно только для чтения.

Стандартные отклонения предиктора, заданные как числовой вектор.

Если Sigma является пустым массивом [] и вы указываете 'Standardize',true, набор инкрементных функций фитинга Sigma к переменной предиктора стандартные отклонения, оцененные в течение периода оценки, указанного EstimationPeriod.

Невозможно указать Sigma непосредственно.

Типы данных: single | double

`Solver` - Метод минимизации целевой функции
`'scale-invariant'` (по умолчанию) | `'sgd'` | `'asgd'`

Это свойство доступно только для чтения.

Метод минимизации целевой функции, указанный как значение в этой таблице.

Стоимость Описание Примечания

Стоимость	Описание	Примечания
`'scale-invariant'`	Адаптивный инвариантный решатель масштаба для инкрементного обучения [1]	Этот алгоритм не содержит параметров и может адаптироваться к различиям в шкалах предикторов. Попробуйте использовать этот алгоритм перед использованием SGD или ASGD. Перетасовка входящих партий перед `fit` функция подходит для модели, набор `Shuffle` кому `true`.
`'sgd'`	Стохастический градиентный спуск (SGD) [3][2]	Чтобы эффективно работать с SGD, стандартизируйте данные и укажите адекватные значения для гиперпараметров, используя опции, перечисленные в параметрах решателя SGD и ASGD. `fit` функция всегда тасует входящий пакет данных перед подгонкой модели.
`'asgd'`	Средний стохастический градиентный спуск (ASGD) [4]	Чтобы эффективно работать с ASGD, стандартизируйте данные и укажите адекватные значения для гиперпараметров, используя опции, перечисленные в параметрах решателя SGD и ASGD. `fit` функция всегда тасует входящий пакет данных перед подгонкой модели.

'scale-invariant'

Адаптивный инвариантный решатель масштаба для инкрементного обучения [1]

Этот алгоритм не содержит параметров и может адаптироваться к различиям в шкалах предикторов. Попробуйте использовать этот алгоритм перед использованием SGD или ASGD.
Перетасовка входящих партий перед fit функция подходит для модели, набор Shuffle кому true.

'sgd'

Стохастический градиентный спуск (SGD) [3][2]

Чтобы эффективно работать с SGD, стандартизируйте данные и укажите адекватные значения для гиперпараметров, используя опции, перечисленные в параметрах решателя SGD и ASGD.
fit функция всегда тасует входящий пакет данных перед подгонкой модели.

'asgd'

Средний стохастический градиентный спуск (ASGD) [4]

Чтобы эффективно работать с ASGD, стандартизируйте данные и укажите адекватные значения для гиперпараметров, используя опции, перечисленные в параметрах решателя SGD и ASGD.
fit функция всегда тасует входящий пакет данных перед подгонкой модели.

При преобразовании традиционно обученной модели линейной регрессии (RegressionLinear) для создания Mdl, чей ModelParameters.Solver свойство - 'sgd' или 'asgd', Solver определяется ModelParameters.Solver свойство традиционно обученной модели.

Типы данных: char | string

`SolverOptions` - Целевые конфигурации решателя
структурный массив

Это свойство доступно только для чтения.

Целевые конфигурации решателя, заданные как массив структуры. Поля SolverOptions - свойства, специфичные для указанного решателя; Solver.

Типы данных: struct

Параметры решателя SGD и ASGD

`BatchSize` - Размер мини-партии
положительное целое число

Это свойство доступно только для чтения.

Размер мини-пакета, указанный как положительное целое число. При каждой итерации во время обучения, incrementalRegressionLinear использование min(BatchSize,numObs) наблюдения для вычисления подградуора, где numObs - количество наблюдений в данных обучения, переданных fit или updateMetricsAndFit.

При преобразовании традиционно обученной модели линейной регрессии (RegressionLinear) для создания Mdl, чей ModelParameters.Solver свойство - 'sgd' или 'asgd', BatchSize определяется ModelParameters.BatchSize свойство традиционно обученной модели. В противном случае значение по умолчанию - 10.

Типы данных: single | double

`Lambda` - Сила термина регуляризации гребня (L2)
неотрицательный скаляр

Это свойство доступно только для чтения.

Сила члена регуляризации хребта (L2), определяемая как неотрицательный скаляр.

При преобразовании традиционно обученной линейной модели для регрессии гребня (RegressionLinear объект с Regularization свойство равно 'ridge (L2)') для создания Mdl, Lambda определяется значением Lambda свойство традиционно обученной модели. В противном случае значение по умолчанию - 1e-5.

Типы данных: double | single

`LearnRate` - Коэффициент обучения
`'auto'` | положительный скаляр

Это свойство доступно только для чтения.

Коэффициент обучения, указанный как 'auto' или положительный скаляр. LearnRate управляет размером шага оптимизации путем масштабирования целевого подградуира.

При указании 'auto':

Если EstimationPeriod является 0, начальная скорость обучения 0.7.
Если EstimationPeriod > 0, начальная скорость обучения 1/sqrt(1+max(sum(X.^2,obsDim))), где obsDim является 1 если наблюдения составляют столбцы данных предиктора, и 2 в противном случае. fit и updateMetricsAndFit установите значение при передаче модели и данных обучения на.

При преобразовании традиционно обученной модели линейной регрессии (RegressionLinear) для создания Mdl, чей ModelParameters.Solver свойство - 'sgd' или 'asgd', LearnRate определяется ModelParameters.LearnRate свойство традиционно обученной модели.

LearnRateSchedule свойство определяет скорость обучения для последующих циклов обучения.

Пример: 'LearnRate',0.001

Типы данных: single | double | char | string

`LearnRateSchedule` - График обучения
`'decaying'` (по умолчанию) | `'constant'`

Это свойство доступно только для чтения.

График скорости обучения, указанный как значение в этой таблице, где LearnRate определяет ɣ0 начальной скорости обучения.

Стоимость Описание

'constant' Уровень обучения является ɣ0 для всех циклов обучения.

Стоимость	Описание
`'constant'`	Уровень обучения является ɣ0 для всех циклов обучения.
`'decaying'`	Скорость обучения в учебном цикле t составляет $_{γ t} \frac{=_{}}{{γ 0 (1_{} +}^{}}$ λ γ 0t) c. λ - значение `Lambda`. Если `Solver` является `'sgd'`, c = `1`. Если `Solver` является `'asgd'`: c = `2/3` если `Learner` является `'leastsquares'` c = `3/4` если `Learner` является `'svm'` [4]

'decaying'

Скорость обучения в учебном цикле t составляет

$_{γ t} \frac{=_{}}{{γ 0 (1_{} +}^{}}$ λ γ 0t) c.

λ - значение Lambda.
Если Solver является 'sgd', c = 1.
Если Solver является 'asgd':
- c = 2/3 если Learner является 'leastsquares'
- c = 3/4 если Learner является 'svm' [4]

Типы данных: char | string

Опции адаптивного масштабирования-инвариантного решателя

`Shuffle` - Флаг для тасования наблюдений в партии
`true` (по умолчанию) | `false`

Это свойство доступно только для чтения.

Флаг для тасования наблюдений в пакете при каждом цикле обучения, указанный как значение в этой таблице.

Стоимость	Описание
`true`	Программа выполняет тасование наблюдений в каждом входящем пакете данных перед обработкой аппарата. Это действие уменьшает смещение, вызванное схемой выборки.
`false`	Программное обеспечение обрабатывает данные в полученном порядке.

Типы данных: logical

Параметры показателей производительности

`IsWarm` - Флаг, указывающий, отслеживает ли модель метрики производительности
`false` | `true`

Это свойство доступно только для чтения.

Флаг, указывающий, отслеживает ли инкрементная модель метрики производительности, указанные как false или true. Инкрементная модель Mdl теплый (IsWarm становится true) после подгонки инкрементных функций фитинга MetricsWarmupPeriod наблюдения за инкрементной моделью (то есть EstimationPeriod + MetricsWarmupPeriod наблюдения).

Стоимость	Описание
`true`	Инкрементная модель `Mdl` тепло. Следовательно, `updateMetrics` и `updateMetricsAndFit` отслеживать метрики производительности в `Metrics` имущество `Mdl`.
`false`	`updateMetrics` и `updateMetricsAndFit` не отслеживайте метрики производительности.

Типы данных: logical

`Metrics` - Показатели производительности модели
стол

Это свойство доступно только для чтения.

Метрики производительности модели обновлены во время инкрементного обучения updateMetrics и updateMetricsAndFit, заданная как таблица с двумя столбцами и m строками, где m - количество метрик, заданное 'Metrics' аргумент пары имя-значение.

Столбцы Metrics помечены Cumulative и Window.

Cumulative: Элемент j - производительность модели, измеряемая метрикой j, с момента, когда модель стала теплой (IsHeam 1).
Window: Элемент j - производительность модели, измеряемая метрикой j, оценивается по всем наблюдениям в пределах окна, указанного MetricsWindowSize собственность. Обновления программного обеспечения Window после обработки MetricsWindowSize наблюдения.

Строки помечены указанными метриками. Для получения более подробной информации см. 'Metrics'.

Типы данных: table

`MetricsWarmupPeriod` - Количество наблюдений перед отслеживанием показателей производительности
`1000` (по умолчанию) | неотрицательное целое число

Это свойство доступно только для чтения.

Количество наблюдений, которым должна соответствовать инкрементная модель, прежде чем она будет отслеживать метрики производительности в своей Metrics , указанное как неотрицательное целое число.

Дополнительные сведения см. в разделе Показатели производительности.

Типы данных: single | double

`MetricsWindowSize` - Количество наблюдений, используемых для вычисления показателей производительности окна
`200` (по умолчанию) | положительное целое число

Это свойство доступно только для чтения.

Число наблюдений, используемых для вычисления метрик производительности окна, указанных как положительное целое число.

Типы данных: single | double

Функции объекта

`fit`	Обучение линейной модели для инкрементного обучения
`updateMetricsAndFit`	Обновление показателей производительности в линейной модели для инкрементного обучения с учетом новых данных и модели поезда
`updateMetrics`	Обновление показателей производительности в линейной модели для инкрементного обучения с учетом новых данных
`loss`	Потеря линейной модели для инкрементного обучения по пакету данных
`predict`	Прогнозирование ответов для новых наблюдений из линейной модели для инкрементного обучения

Примеры

свернуть все

Создание добавочного ученика без предварительной информации

Открыть сценарий в реальном времени

Создайте линейную модель приращения по умолчанию для регрессии.

Mdl = incrementalRegressionLinear()

Mdl = 
  incrementalRegressionLinear

               IsWarm: 0
              Metrics: [1x2 table]
    ResponseTransform: 'none'
                 Beta: [0x1 double]
                 Bias: 0
              Learner: 'svm'


  Properties, Methods

Mdl.EstimationPeriod

ans = 1000

Mdl является incrementalRegressionLinear объект модели. Все его свойства доступны только для чтения.

Mdl должны соответствовать данным, прежде чем их можно будет использовать для выполнения любых других операций. Программное обеспечение устанавливает период оценки равным 1000, поскольку половина ширины полосы нечувствительности к эпсилону Epsilon неизвестно. Можно задать Epsilon к положительному скаляру с плавающей запятой с помощью 'Epsilon' аргумент пары имя-значение. В результате этого действия период оценки по умолчанию равен 0.

Загрузите набор данных руки робота.

load robotarm

Для получения подробной информации о наборе данных введите Description в командной строке.

Подгонка инкрементной модели к данным обучения с помощью updateMetricsAndfit функция. Чтобы смоделировать поток данных, поместите модель в порции по 50 наблюдений за раз. При каждой итерации:

Процесс 50 наблюдений.
Перезаписать предыдущую инкрементную модель новой, установленной для входящего наблюдения.
Сохраните $_{β1}$ , кумулятивные метрики и оконные метрики, чтобы увидеть, как они развиваются во время инкрементного обучения.

% Preallocation
n = numel(ytrain);
numObsPerChunk = 50;
nchunk = floor(n/numObsPerChunk);
ei = array2table(zeros(nchunk,2),'VariableNames',["Cumulative" "Window"]);
beta1 = zeros(nchunk,1);    

% Incremental fitting
for j = 1:nchunk
    ibegin = min(n,numObsPerChunk*(j-1) + 1);
    iend   = min(n,numObsPerChunk*j);
    idx = ibegin:iend;    
    Mdl = updateMetricsAndFit(Mdl,Xtrain(idx,:),ytrain(idx));
    ei{j,:} = Mdl.Metrics{"EpsilonInsensitiveLoss",:};
    beta1(j + 1) = Mdl.Beta(1);
end

IncrementalMdl является incrementalRegressionLinear объект модели обучен всем данным в потоке. В то время как updateMetricsAndFit обрабатывает первые 1000 наблюдений, сохраняет буфер для оценки Epsilon; функция не подходит к коэффициентам до окончания этого периода оценки. Во время инкрементного обучения и после разогрева модели updateMetricsAndFit проверяет производительность модели на входящем наблюдении, а затем подгоняет модель под это наблюдение.

Чтобы увидеть, как метрики производительности и $_{β1}$ развивались во время обучения, постройте их график на отдельных вложенных графиках.

figure;
subplot(2,1,1)
plot(beta1)
ylabel('\beta_1')
xlim([0 nchunk]);
xline(Mdl.EstimationPeriod/numObsPerChunk,'r-.');
subplot(2,1,2)
h = plot(ei.Variables);
xlim([0 nchunk]);
ylabel('Epsilon Insensitive Loss')
xline(Mdl.EstimationPeriod/numObsPerChunk,'r-.');
xline((Mdl.EstimationPeriod + Mdl.MetricsWarmupPeriod)/numObsPerChunk,'g-.');
legend(h,ei.Properties.VariableNames)
xlabel('Iteration')

Figure contains 2 axes. Axes 1 contains 2 objects of type line, constantline. Axes 2 contains 4 objects of type line, constantline. These objects represent Cumulative, Window.

Сюжет говорит о том, что updateMetricsAndFit выполняет следующее:

После периода оценки (первые 20 итераций) вписать $_{β1}$ во все инкрементные итерации обучения.
Вычислять метрики производительности только после периода прогрева метрик.
Вычислите кумулятивные метрики во время каждой итерации.
Вычислите метрику окна после обработки 500 наблюдений (4 итерации).

Настройка параметров инкрементного обучения

Открыть сценарий в реальном времени

Подготовьте учащегося инкрементной регрессии, указав период прогрева метрик, в течение которого updateMetricsAndFit функция подходит только для модели. Укажите размер окна метрик, равный 500 наблюдениям. Обучайте модель с помощью SGD и настройте размер партии SGD, скорость обучения и параметр регуляризации.

Загрузите набор данных руки робота.

load robotarm
n = numel(ytrain);

Для получения подробной информации о наборе данных введите Description в командной строке.

Создайте линейную модель приращения для регрессии. Сконфигурируйте модель следующим образом:

Укажите решатель SGD.
Предположим, что значение параметра регуляризации гребня 0,001, размер партии SGD 20, скорость обучения 0,002 и половина ширины полосы нечувствительности эпсилона для SVM 0,05 хорошо работают для проблемы.
Укажите, что инкрементные фитинговые функции обрабатывают необработанные (нестандартные) данные предиктора.
Укажите период прогрева метрик, равный 1000 наблюдениям.
Укажите размер окна метрик, равный 500 наблюдениям.
Отслеживание нечувствительных потерь epsilon, MSE и средней абсолютной ошибки (MAE) для измерения производительности модели. Программное обеспечение поддерживает нечувствительные потери epsilon и MSE. Создайте анонимную функцию, измеряющую абсолютную ошибку каждого нового наблюдения. Создание массива структуры, содержащего имя MeanAbsoluteError и его соответствующей функции.

maefcn = @(z,zfit)abs(z - zfit);
maemetric = struct("MeanAbsoluteError",maefcn);

Mdl = incrementalRegressionLinear('Epsilon',0.05,...
    'Solver','sgd','Lambda',0.001,'BatchSize',20,'LearnRate',0.002,...
    'Standardize',false,...
    'MetricsWarmupPeriod',1000,'MetricsWindowSize',500,...
    'Metrics',{'epsiloninsensitive' 'mse' maemetric})

Mdl = 
  incrementalRegressionLinear

               IsWarm: 0
              Metrics: [3x2 table]
    ResponseTransform: 'none'
                 Beta: [0x1 double]
                 Bias: 0
              Learner: 'svm'


  Properties, Methods

Mdl является incrementalRegressionLinear объект модели, сконфигурированный для инкрементного обучения без периода оценки.

Подгонка инкрементной модели к данным с помощью updateMetricsAndfit функция. При каждой итерации:

Моделирование потока данных путем обработки части из 50 наблюдений. Следует отметить, что размер блока отличается от размера пакета SGD.
Перезаписать предыдущую инкрементную модель новой, установленной для входящего наблюдения.
Сохраните оцененный коэффициент $_{β10}$ , кумулятивные метрики и оконные метрики, чтобы увидеть, как они развиваются во время инкрементного обучения.

% Preallocation
numObsPerChunk = 50;
nchunk = floor(n/numObsPerChunk);
ei = array2table(zeros(nchunk,2),'VariableNames',["Cumulative" "Window"]);
mse = array2table(zeros(nchunk,2),'VariableNames',["Cumulative" "Window"]);
mae = array2table(zeros(nchunk,2),'VariableNames',["Cumulative" "Window"]);
beta10 = zeros(nchunk,1);    

% Incremental fitting
for j = 1:nchunk
    ibegin = min(n,numObsPerChunk*(j-1) + 1);
    iend   = min(n,numObsPerChunk*j);
    idx = ibegin:iend;    
    Mdl = updateMetricsAndFit(Mdl,Xtrain(idx,:),ytrain(idx));
    ei{j,:} = Mdl.Metrics{"EpsilonInsensitiveLoss",:};
    mse{j,:} = Mdl.Metrics{"MeanSquaredError",:};
    mae{j,:} = Mdl.Metrics{"MeanAbsoluteError",:};
    beta10(j + 1) = Mdl.Beta(10);
end

IncrementalMdl является incrementalRegressionLinear объект модели обучен всем данным в потоке. Во время инкрементного обучения и после разогрева модели updateMetricsAndFit проверяет производительность модели на входящем наблюдении, а затем подгоняет модель под это наблюдение.

Чтобы увидеть, как метрики производительности и $_{β10}$ развивались во время обучения, постройте их график на отдельных вложенных графиках.

figure;
subplot(2,2,1)
plot(beta10)
ylabel('\beta_{10}')
xlim([0 nchunk]);
xline(Mdl.MetricsWarmupPeriod/numObsPerChunk,'r-.');
xlabel('Iteration')
subplot(2,2,2)
h = plot(ei.Variables);
xlim([0 nchunk]);
ylabel('Epsilon Insensitive Loss')
xline(Mdl.MetricsWarmupPeriod/numObsPerChunk,'r-.');
legend(h,ei.Properties.VariableNames)
xlabel('Iteration')
subplot(2,2,3)
h = plot(mse.Variables);
xlim([0 nchunk]);
ylabel('MSE')
xline(Mdl.MetricsWarmupPeriod/numObsPerChunk,'r-.');
legend(h,mse.Properties.VariableNames)
xlabel('Iteration')
subplot(2,2,4)
h = plot(mae.Variables);
xlim([0 nchunk]);
ylabel('MAE')
xline(Mdl.MetricsWarmupPeriod/numObsPerChunk,'r-.');
legend(h,mae.Properties.VariableNames)
xlabel('Iteration')

Figure contains 4 axes. Axes 1 contains 2 objects of type line, constantline. Axes 2 contains 3 objects of type line, constantline. These objects represent Cumulative, Window. Axes 3 contains 3 objects of type line, constantline. These objects represent Cumulative, Window. Axes 4 contains 3 objects of type line, constantline. These objects represent Cumulative, Window.

Сюжет говорит о том, что updateMetricsAndFit выполняет следующее:

Вписать $_{β10}$ во все инкрементные итерации обучения.
Вычислять метрики производительности только после периода прогрева метрик.
Вычислите кумулятивные метрики во время каждой итерации.
Вычислите метрику окна после обработки 500 наблюдений (10 итераций).

Преобразование традиционно обученной модели в инкрементную

Открыть сценарий в реальном времени

Обучение модели линейной регрессии с помощью fitrlinearпреобразуйте его в добавочный ученик, отслеживайте его производительность и подгоняйте под потоковые данные. Переносите варианты обучения с традиционного на инкрементное обучение.

Загрузка и предварительная обработка данных

Загрузите набор данных по жилью в Нью-Йорке за 2015 год и перетасуйте данные. Дополнительные сведения о данных см. в разделе Открытые данные NYC.

load NYCHousing2015
rng(1); % For reproducibility
n = size(NYCHousing2015,1);
idxshuff = randsample(n,n);
NYCHousing2015 = NYCHousing2015(idxshuff,:);

Предположим, что данные, собранные с Манхэттена (BOROUGH = 1) был собран с использованием нового метода, который удваивает его качество. Создание весовой переменной с атрибутами 2 на наблюдения, собранные с Манхэттена, и 1 ко всем другим замечаниям.

NYCHousing2015.W = ones(n,1) + (NYCHousing2015.BOROUGH == 1);

Извлечь переменную ответа SALEPRICE из таблицы. Для числовой устойчивости, шкала SALEPRICE около 1e6.

Y = NYCHousing2015.SALEPRICE/1e6;
NYCHousing2015.SALEPRICE = [];

Создайте фиктивные матрицы переменных из категориальных предикторов.

catvars = ["BOROUGH" "BUILDINGCLASSCATEGORY" "NEIGHBORHOOD"];
dumvarstbl = varfun(@(x)dummyvar(categorical(x)),NYCHousing2015,...
    'InputVariables',catvars);
dumvarmat = table2array(dumvarstbl);
NYCHousing2015(:,catvars) = [];

Все остальные числовые переменные в таблице рассматриваются как линейные предикторы продажной цены. Соедините матрицу фиктивных переменных с остальными данными предиктора. Транспонируйте результирующую матрицу предиктора.

idxnum = varfun(@isnumeric,NYCHousing2015,'OutputFormat','uniform');
X = [dumvarmat NYCHousing2015{:,idxnum}]';

Модель линейной регрессии поезда

Подгонка модели линейной регрессии к случайной выборке половины данных.

idxtt = randsample([true false],n,true);
TTMdl = fitrlinear(X(:,idxtt),Y(idxtt),'ObservationsIn','columns',...
    'Weights',NYCHousing2015.W(idxtt))

TTMdl = 
  RegressionLinear
         ResponseName: 'Y'
    ResponseTransform: 'none'
                 Beta: [313x1 double]
                 Bias: 0.1116
               Lambda: 2.1977e-05
              Learner: 'svm'


  Properties, Methods

TTMdl является RegressionLinear объект модели, представляющий традиционно обученную модель линейной регрессии.

Преобразовать обученную модель

Преобразование традиционно обученной модели линейной регрессии в модель линейной регрессии для инкрементного обучения.

IncrementalMdl = incrementalLearner(TTMdl)

IncrementalMdl = 
  incrementalRegressionLinear

               IsWarm: 1
              Metrics: [1x2 table]
    ResponseTransform: 'none'
                 Beta: [313x1 double]
                 Bias: 0.1116
              Learner: 'svm'


  Properties, Methods

Отдельно отслеживать показатели производительности и модель соответствия

Инкрементное изучение остальных данных с помощью updateMetrics и fit функции. Моделирование потока данных путем одновременной обработки 500 наблюдений. При каждой итерации:

Звонить updateMetrics для обновления кумулятивной и оконной нечувствительной потери модели с учетом входящего фрагмента наблюдений. Перезаписать предыдущую инкрементную модель для обновления потерь в Metrics собственность. Обратите внимание, что функция не подходит модели к порции данных - порция является «новыми» данными для модели. Укажите, что наблюдения ориентированы в столбцах, и укажите веса наблюдений.
Звонить fit для соответствия модели входящему фрагменту наблюдений. Перезаписать предыдущую инкрементную модель для обновления параметров модели. Укажите, что наблюдения ориентированы в столбцах, и укажите веса наблюдений.
Запишите потери и последний оцененный коэффициент $_{β313}$ .

% Preallocation
idxil = ~idxtt;
nil = sum(idxil);
numObsPerChunk = 500;
nchunk = floor(nil/numObsPerChunk);
ei = array2table(zeros(nchunk,2),'VariableNames',["Cumulative" "Window"]);
beta313 = [IncrementalMdl.Beta(end); zeros(nchunk,1)];
Xil = X(:,idxil);
Yil = Y(idxil);
Wil = NYCHousing2015.W(idxil);

% Incremental fitting
for j = 1:nchunk
    ibegin = min(nil,numObsPerChunk*(j-1) + 1);
    iend   = min(nil,numObsPerChunk*j);
    idx = ibegin:iend;
    IncrementalMdl = updateMetrics(IncrementalMdl,Xil(:,idx),Yil(idx),...
        'ObservationsIn','columns','Weights',Wil(idx));
    ei{j,:} = IncrementalMdl.Metrics{"EpsilonInsensitiveLoss",:};
    IncrementalMdl = fit(IncrementalMdl,Xil(:,idx),Yil(idx),'ObservationsIn','columns',...
        'Weights',Wil(idx));
    beta313(j + 1) = IncrementalMdl.Beta(end);
end

IncrementalMdl является incrementalRegressionLinear объект модели обучен всем данным в потоке.

Кроме того, можно использовать updateMetricsAndFit для обновления метрик производительности модели с учетом нового фрагмента данных, а затем подгонки модели к данным.

Постройте график трассировки метрик производительности и оценочного коэффициента $_{β313}$ .

figure;
subplot(2,1,1)
h = plot(ei.Variables);
xlim([0 nchunk]);
ylabel('Epsilon Insensitive Loss')
legend(h,ei.Properties.VariableNames)
subplot(2,1,2)
plot(beta313)
ylabel('\beta_{313}')
xlim([0 nchunk]);
xlabel('Iteration')

Figure contains 2 axes. Axes 1 contains 2 objects of type line. These objects represent Cumulative, Window. Axes 2 contains an object of type line.

Кумулятивные потери постепенно изменяются с каждой итерацией (порция из 500 наблюдений), в то время как оконные потери скачет. Поскольку по умолчанию окно метрик имеет значение 200, updateMetrics измеряет производительность на основе последних 200 наблюдений в каждом 500 наблюдательном блоке.

$_{β313}$ резко меняется, затем выравнивается как fit обрабатывает куски наблюдений.

Подробнее

развернуть все

Инкрементное обучение

Инкрементное обучение, или онлайн-обучение, - это ветвь машинного обучения, связанная с обработкой входящих данных из потока данных, возможно, без знания распределения переменных предиктора, аспектов предсказания или целевой функции (включая значения параметров настройки) или того, помечены ли наблюдения. Инкрементное обучение отличается от традиционного машинного обучения, когда достаточно помеченных данных доступно для соответствия модели, выполнения перекрестной проверки для настройки гиперпараметров и вывода распределения предиктора.

Учитывая поступающие наблюдения, модель инкрементного обучения обрабатывает данные любым из следующих способов, но обычно в таком порядке:

Прогнозировать метки.
Измерьте прогностическую производительность.
Проверьте наличие структурных разрывов или дрейфа в модели.
Подгоните модель к входящим наблюдениям.

Адаптивный решатель масштаба - инвариантный решатель для инкрементного обучения

Адаптивный инвариантный по масштабу решатель для инкрементного обучения, представленный в [1], представляет собой целевой решатель на основе градиентного спуска для обучения линейным прогностическим моделям. Решатель свободен от гиперпараметров, нечувствителен к различиям в шкалах переменных предиктора и не требует предварительного знания распределения переменных предиктора. Эти характеристики делают его хорошо подходящим для инкрементного обучения.

Стандартные решатели SGD и ASGD чувствительны к различным масштабам переменных предиктора, что приводит к моделям, которые могут работать плохо. Для достижения лучшей точности с использованием SGD и ASGD можно стандартизировать данные предиктора, а настройка параметров регуляризации и скорости обучения может потребовать настройки. Для традиционного машинного обучения доступно достаточно данных для настройки гиперпараметров путем перекрестной проверки и стандартизации предикторов. Однако для инкрементного обучения достаточное количество данных может быть недоступно (например, наблюдения могут быть доступны только по одному), и распределение предикторов может быть неизвестно. Эти характеристики делают настройку параметров и стандартизацию предиктора трудной или невозможной во время инкрементного обучения.

Инкрементные функции аппроксимации для регрессии fit и updateMetricsAndFit использовать более консервативный ScInOL1 вариант алгоритма.

Совет

После создания модели можно создать код C/C + +, который выполняет инкрементное изучение потока данных. Для создания кода C/C + + требуется Coder™ MATLAB. Дополнительные сведения см. в разделе Введение в создание кода.

Алгоритмы

развернуть все

Период оценки

В течение периода оценки инкрементные фитинговые функции fit и updateMetricsAndFit использовать первый входящий EstimationPeriod наблюдения для оценки (настройки) гиперпараметров, необходимых для дополнительного обучения. В этой таблице описываются гиперпараметры и время их оценки или настройки. Оценка выполняется только тогда, когда EstimationPeriod является положительным.

Гиперпараметр Свойство модели Использовать Оценка гиперпараметров

Предикторные средства и стандартные отклонения

Гиперпараметр	Свойство модели	Использовать	Оценка гиперпараметров
Предикторные средства и стандартные отклонения	`Mu` и `Sigma`	Стандартизация данных предиктора	Если применяются оба этих условия: Функции инкрементной подгонки сконфигурированы для стандартизации данных предиктора (см. Стандартизация данных). `Mdl.Mu` и `Mdl.Sigma` пустые массивы `[]`.
Уровень обучения	LearnRate	Настройка размера шага решателя	Если применяются оба этих условия: Решателем является SGD или ASGD (см. Решатель). Вы не устанавливаете `'LearnRate'` аргумент пары имя-значение.
Половина ширины эпсилоновой нечувствительной полосы	Эпсилон	Контрольное число векторов поддержки	Если применяются оба этих условия: Учеником является SVM (см. раздел Ученик). Вы не устанавливаете `'Epsilon'` аргумент пары имя-значение.

Mu и Sigma

Стандартизация данных предиктора

Если применяются оба этих условия:

Функции инкрементной подгонки сконфигурированы для стандартизации данных предиктора (см. Стандартизация данных).
Mdl.Mu и Mdl.Sigma пустые массивы [].

Уровень обучения

LearnRate

Настройка размера шага решателя

Если применяются оба этих условия:

Решателем является SGD или ASGD (см. Решатель).
Вы не устанавливаете 'LearnRate' аргумент пары имя-значение.

Половина ширины эпсилоновой нечувствительной полосы

Эпсилон

Контрольное число векторов поддержки

Если применяются оба этих условия:

Учеником является SVM (см. раздел Ученик).
Вы не устанавливаете 'Epsilon' аргумент пары имя-значение.

Функции соответствуют только последнему наблюдению периода оценки инкрементной модели, и они не используют ни одно из наблюдений для отслеживания производительности модели. В конце периода оценки функции обновляют свойства, хранящие гиперпараметры.

Стандартизация данных

Если инкрементные функции обучения сконфигурированы для стандартизации переменных предиктора, они делают это, используя средства и стандартные отклонения, сохраненные в Mu и Sigma свойства модели инкрементного обучения Mdl.

При установке 'Standardize',true и период положительной оценки (см. Период оценки), и Mdl.Mu и Mdl.Sigma пустые, средства оценки инкрементных функций подгонки и стандартные отклонения с использованием наблюдений периода оценки.
При установке 'Standardize','auto' (по умолчанию), применяются следующие условия.
- При создании incrementalRegressionLinear путем преобразования традиционно обученной регрессионной модели SVM (CompactRegressionSVM или RegressionSVM) и Mu и Sigma свойства преобразуемой модели являются пустыми массивами []функции инкрементного обучения не стандартизируют переменные предиктора. Если Mu и Sigma свойства преобразуемой модели являются непустыми, функции инкрементного обучения стандартизируют переменные предиктора с использованием указанных средств и стандартных отклонений. Инкрементные фитинговые функции не оценивают новые средства и стандартные отклонения независимо от продолжительности периода оценки.
- При создании incrementalRegressionLinear путем преобразования модели линейной регрессии (RegressionLinear), функции инкрементного обучения не стандартизируют данные независимо от продолжительности периода оценки.
- Если не преобразовать традиционно обученную модель, функции инкрементного обучения стандартизируют данные предиктора только при указании решателя SGD (см. Solver) и период положительной оценки (см. Период оценки).
Когда функции инкрементной подгонки оценивают предикторные средства и стандартные отклонения, функции вычисляют взвешенные средства и взвешенные стандартные отклонения, используя наблюдения периода оценки. В частности, функции стандартизируют предиктор j (_xj), используя

$_{}^{} \frac{_{}_{}^{}}{_{}^{xj*=xj-μj*σj*}} .$
- _xj - предиктор j, и _xjk - наблюдение k предиктора j в периоде оценки.
- $_{}^{} \frac{}{\underset{}{}_{}} \underset{}{}_{}_{μj∗=1∑kwk∑kwkxjk} .$
- ${(_{}^{σj*})}^{} \frac{}{\underset{}{}_{}} \underset{}{}_{} {2=1\sumkwk\sumkwk_{(}_{}^{}}^{xjk−μj∗})$ 2.
- _wj - наблюдаемый вес j.

Показатели производительности

updateMetrics и updateMetricsAndFit функции отслеживают показатели производительности модели ('Metrics') из новых данных, когда инкрементная модель является теплой (свойство IsHeam). Инкрементная модель нагревается после fit или updateMetricsAndFit подгонка инкрементной модели к наблюдениям MetrityWarmupPeriod, которые являются периодом прогрева метрик.
Если значение параметра Period > 0, функции оценивают гиперпараметры перед подгонкой модели к данным. Поэтому функции должны обрабатывать дополнительную EstimationPeriod наблюдения перед тем, как модель начнет период прогрева метрик.
Metrics свойство инкрементной модели хранит две формы каждой метрики производительности в качестве переменных (столбцов) таблицы, Cumulative и Window, с отдельными метриками в строках. Когда инкрементная модель является теплой, updateMetrics и updateMetricsAndFit обновить метрики на следующих частотах:
- Cumulative - Функции вычисляют кумулятивные метрики с момента начала отслеживания производительности модели. Функции обновляют метрики при каждом вызове функций и основывают расчет на всем предоставленном наборе данных.
- Window - функции вычисляют метрику на основе всех наблюдений в пределах окна, определяемого аргументом пары имя-значение MetrityWindowSize. MetricsWindowSize также определяет частоту обновления программного обеспечения Window метрики. Например, если MetricsWindowSize 20, функции вычисляют метрики на основе последних 20 наблюдений в предоставленных данных (X((end – 20 + 1):end,:) и Y((end – 20 + 1):end)).
  Инкрементные функции, отслеживающие метрики производительности в пределах окна, используют следующий процесс:
  1. Для каждой заданной метрики сохраните буфер длиной MetricsWindowSize и буфер весов наблюдения.
  2. Заполните элементы буфера метрик производительностью модели на основе пакетов входящих наблюдений и сохраните соответствующие веса наблюдений в буфере весов.
  3. При заполнении буфера перезаписать Mdl.Metrics.Window со средневзвешенной производительностью в окне метрик. Если буфер переполнен, когда функция обрабатывает пакет наблюдений, последний входящий MetricsWindowSize наблюдения поступают в буфер, а самые ранние наблюдения удаляются из буфера. Например, предположим MetricsWindowSize равно 20, буфер метрик имеет 10 значений из ранее обработанного пакета, и 15 значений являются входящими. Для создания окна длины 20 используются измерения из 15 входящих наблюдений и 5 последних измерений из предыдущего пакета.

Ссылки

[1] Кемпка, Михал, Войцех Котловский и Манфред К. Вармут. «Адаптивный масштаб - инвариантные онлайн-алгоритмы для обучения линейным моделям». КоРР (февраль 2019). https://arxiv.org/abs/1902.07528.

[2] Лэнгфорд, Дж., Л. Ли и Т. Чжан. «Разреженное онлайн-обучение через усеченный градиент». Дж. Мач. Рес., т. 10, 2009, стр. 777-801.

[3] Шалев-Шварц, С., Я. Сингер и Н. Сребро. «Pegasos: Основной оценочный вычислитель субпогренов для SVM». Материалы 24-й Международной конференции по машинному обучению, ICML "07, 2007, стр. 807-814.

[4] Сюй, Вэй. «К оптимальному однопроходному крупномасштабному обучению со усредненным стохастическим градиентным спуском». CoRR, abs/1107.2490, 2011.

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Примечания и ограничения по использованию:

Все функции объекта incrementalRegressionLinear создание кода поддержки объекта модели.
При настройке Mdl для перетасовки данных (см. Решатель и перетасовка), fit функция случайным образом перетасовывает каждый входящий пакет наблюдений, прежде чем он подходит модели к пакету. Порядок тасованных наблюдений может не соответствовать порядку, сгенерированному MATLAB.
При создании кода, который загружает или создает incrementalRegressionLinear объект модели, NumPredictors свойство должно отражать число переменных предиктора.

Дополнительные сведения см. в разделе Введение в создание кода.

См. также

Функции

fit | incrementalLearner | incrementalLearner | predict | updateMetrics | updateMetricsAndFit

Объекты

CompactRegressionSVM | RegressionLinear | RegressionSVM

Темы

Представлен в R2020b

Документация

incrementalRegressionLinear

Описание

Создание

Синтаксис

Описание

Входные аргументы

'Standardize' - Флаг для стандартизации данных предиктора 'auto' (по умолчанию) | false | true

Свойства

Параметры регрессионной модели

Beta - Коэффициенты линейной модели β числовой вектор

Bias - Модельный перехват β0 числовой скаляр

Epsilon - Половина ширины эпсилоновой нечувствительной полосы 'auto' | неотрицательный скаляр

FittedLoss - Функция потерь, используемая для подгонки линейной модели 'epsiloninsensitive' | 'mse'

Learner - Тип модели линейной регрессии 'leastsquares' | 'svm'

NumPredictors - Количество переменных предиктора 0 (по умолчанию) | неотрицательный числовой скаляр

NumTrainingObservations - Количество наблюдений, соответствующих инкрементной модели 0 (по умолчанию) | неотрицательный числовой скаляр

ResponseTransform - Функция преобразования ответа 'none' | дескриптор функции

Параметры обучения

EstimationPeriod - Количество наблюдений, обработанных для оценки гиперпараметров неотрицательное целое число

FitBias - Флаг включения пересечения линейной модели true | false

Mu - Предиктор означает вектор числовых значений | []

Sigma - Предикторные стандартные отклонения вектор числовых значений | []

Solver - Метод минимизации целевой функции 'scale-invariant' (по умолчанию) | 'sgd' | 'asgd'

SolverOptions - Целевые конфигурации решателя структурный массив

Параметры решателя SGD и ASGD

BatchSize - Размер мини-партии положительное целое число

Lambda - Сила термина регуляризации гребня (L2) неотрицательный скаляр

LearnRate - Коэффициент обучения 'auto' | положительный скаляр

LearnRateSchedule - График обучения 'decaying' (по умолчанию) | 'constant'

Опции адаптивного масштабирования-инвариантного решателя

Shuffle - Флаг для тасования наблюдений в партии true (по умолчанию) | false

Параметры показателей производительности

IsWarm - Флаг, указывающий, отслеживает ли модель метрики производительности false | true

Metrics - Показатели производительности модели стол

MetricsWarmupPeriod - Количество наблюдений перед отслеживанием показателей производительности 1000 (по умолчанию) | неотрицательное целое число

MetricsWindowSize - Количество наблюдений, используемых для вычисления показателей производительности окна 200 (по умолчанию) | положительное целое число

Функции объекта

Примеры

Создание добавочного ученика без предварительной информации

Настройка параметров инкрементного обучения

Преобразование традиционно обученной модели в инкрементную

Подробнее

Инкрементное обучение

Адаптивный решатель масштаба - инвариантный решатель для инкрементного обучения

Совет

Алгоритмы

Период оценки

Стандартизация данных

Показатели производительности

Ссылки

Расширенные возможности

Создание кода C/C + + Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Функции

Объекты

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

`'Standardize'` - Флаг для стандартизации данных предиктора
`'auto'` (по умолчанию) | `false` | `true`

`Beta` - Коэффициенты линейной модели β
числовой вектор

`Bias` - Модельный перехват β0
числовой скаляр

`Epsilon` - Половина ширины эпсилоновой нечувствительной полосы
`'auto'` | неотрицательный скаляр

`FittedLoss` - Функция потерь, используемая для подгонки линейной модели
`'epsiloninsensitive'` | `'mse'`

`Learner` - Тип модели линейной регрессии
`'leastsquares'` | `'svm'`

`NumPredictors` - Количество переменных предиктора
`0` (по умолчанию) | неотрицательный числовой скаляр

`NumTrainingObservations` - Количество наблюдений, соответствующих инкрементной модели
`0` (по умолчанию) | неотрицательный числовой скаляр

`ResponseTransform` - Функция преобразования ответа
`'none'` | дескриптор функции

`EstimationPeriod` - Количество наблюдений, обработанных для оценки гиперпараметров
неотрицательное целое число

`FitBias` - Флаг включения пересечения линейной модели
`true` | `false`

`Mu` - Предиктор означает
вектор числовых значений | `[]`

`Sigma` - Предикторные стандартные отклонения
вектор числовых значений | `[]`

`Solver` - Метод минимизации целевой функции
`'scale-invariant'` (по умолчанию) | `'sgd'` | `'asgd'`

`SolverOptions` - Целевые конфигурации решателя
структурный массив

`BatchSize` - Размер мини-партии
положительное целое число

`Lambda` - Сила термина регуляризации гребня (L2)
неотрицательный скаляр

`LearnRate` - Коэффициент обучения
`'auto'` | положительный скаляр

`LearnRateSchedule` - График обучения
`'decaying'` (по умолчанию) | `'constant'`

`Shuffle` - Флаг для тасования наблюдений в партии
`true` (по умолчанию) | `false`

`IsWarm` - Флаг, указывающий, отслеживает ли модель метрики производительности
`false` | `true`

`Metrics` - Показатели производительности модели
стол

`MetricsWarmupPeriod` - Количество наблюдений перед отслеживанием показателей производительности
`1000` (по умолчанию) | неотрицательное целое число

`MetricsWindowSize` - Количество наблюдений, используемых для вычисления показателей производительности окна
`200` (по умолчанию) | положительное целое число

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™