Опции функции ядра (ковариации)

В управляемом обучении ожидается, что точки с аналогичными значениями предиктора xi, естественно, имеют значения близкого отклика (целевой) yi. В Гауссовских процессах ковариационная функция выражает это сходство [1]. Он задает ковариацию между двумя скрытыми переменными f(xi) и f(xj), где и то и другое xi и xj d векторы -by-1. Другими словами, это определяет, как ответ в одной точкеxi затронуто откликами в других точках xj, <reservedrangesplaceholder3> ≠ <reservedrangesplaceholder2> , i = 1, 2..., n. Ковариационная функцияk(xi,xj) может быть задано различными функциями ядра. Его можно параметризовать в терминах параметров ядра в векторе θ. Следовательно, можно выразить ковариационную функцию как k(xi,xj|θ).

Для многих стандартных функций ядра параметры ядра основаны на стандартном отклонении сигнала σf и характеристическая шкала длины σl. Шкалы длины характеристики кратко определяют, насколько далеко вход значения xi может быть, чтобы значения отклика стали некоррелированными. Оба σl и σf должно быть больше 0, и это может быть реализовано вектором параметризации без ограничений θ, таким что

θ1=logσl,θ2=logσf.

Встроенные ядерные (ковариационные) функции с той же шкалой длины для каждого предиктора:

  • Квадратное экспоненциальное ядро

    Это одна из наиболее часто используемых ковариационных функций и опция по умолчанию для fitrgp. Квадратная экспоненциальная функция ядра определяется как

    k(xi,xj|θ)=σf2exp[12(xi xj)T(xi xj)σl2].

    где σl является характеристической шкалой длины, и σf - стандартное отклонение сигнала.

  • Экспоненциальное ядро

    Можно задать экспоненциальную функцию ядра с помощью 'KernelFunction','exponential' аргумент пары "имя-значение". Эта ковариационная функция определяется

    k(xi,xj|θ)=σf2exp(rσl),

    где σl является характеристической шкалой длины и

    r=(xi xj)T(xi xj)

    - евклидово расстояние между xi и xj.

  • Матерн 3/2

    Вы можете задать функцию ядра Matern 3/2 с помощью 'KernelFunction','matern32' аргумент пары "имя-значение". Эта ковариационная функция определяется

    k(xi,xj|θ)=σf2(1+3rσl)exp(3rσl),

    где

    r=(xi xj)T(xi xj)

    - евклидово расстояние между xi и xj.

  • Матерн 5/2

    Вы можете задать функцию ядра Matern 5/2 с помощью 'KernelFunction','matern52' аргумент пары "имя-значение". Функция ковариации Matern 5/2 задана как

    k(xi,xj)=σf2(1+5rσl+5r23σl2)exp(5rσl),

    где

    r=(xi xj)T(xi xj)

    - евклидово расстояние между xi и xj.

  • Рациональное квадратичное ядро

    Вы можете задать рациональную квадратичную функцию ядра, используя 'KernelFunction','rationalquadratic' аргумент пары "имя-значение". Эта ковариационная функция определяется

    k(xi,xj|θ)=σf2(1+r22ασl2)α,

    где σl - характеристическая шкала длины, α является положительным параметром смеси шкалы, и

    r=(xi xj)T(xi xj)

    - евклидово расстояние между xi и xj.

Возможно использование отдельной шкалы длины σm для каждого m предиктора m = 1, 2,..., d. Встроенные функции ядра (ковариации) с отдельной шкалой длины для каждого предиктора реализуют автоматическое определение релевантности (ARD) [2]. Параметризация без ограничений θ в этом случае

θm=logσm,дляm=1,2,...,dθd+1=logσf.

Встроенные ядерные (ковариационные) функции с отдельной шкалой длины для каждого предиктора:

  • Квадратное экспоненциальное ядро ARD

    Вы можете задать эту функцию ядра, используя 'KernelFunction','ardsquaredexponential' аргумент пары "имя-значение". Эта ковариационная функция является квадратной экспоненциальной функцией ядра с отдельной шкалой длины для каждого предиктора. Он определяется как

    k(xi,xj|θ)=σf2exp[12m=1d(ximxjm)2σm2].

  • Экспоненциальное ядро ARD

    Вы можете задать эту функцию ядра, используя 'KernelFunction','ardexponential' аргумент пары "имя-значение". Эта ковариационная функция является экспоненциальной функцией ядра с отдельной шкалой длины для каждого предиктора. Он определяется как

    k(xi,xj|θ)=σf2exp(r),

    где

    r=m=1d(ximxjm)2σm2.

  • ARD Matern 3/2

    Вы можете задать эту функцию ядра, используя 'KernelFunction','ardmatern32' аргумент пары "имя-значение". Эта ковариационная функция является функцией ядра Matern 3/2 с разной шкалой длины для каждого предиктора. Он определяется как

    k(xi,xj|θ)=σf2(1+3r)exp(3r),

    где

    r=m=1d(ximxjm)2σm2.

  • ARD Matern 5/2

    Вы можете задать эту функцию ядра, используя 'KernelFunction','ardmatern52' аргумент пары "имя-значение". Эта ковариационная функция является функцией ядра Matern 5/2 с разной шкалой длины для каждого предиктора. Он определяется как

    k(xi,xj|θ)=σf2(1+5r+53r2)exp(5r),

    где

    r=m=1d(ximxjm)2σm2.

  • Рациональное квадратичное ядро ARD

    Вы можете задать эту функцию ядра, используя 'KernelFunction','ardrationalquadratic' аргумент пары "имя-значение". Эта ковариационная функция является рациональной квадратичной функцией ядра с отдельной шкалой длины для каждого предиктора. Он определяется как

    k(xi,xj|θ)=σf2(1+12αm=1d(ximxjm)2σm2)α.

Вы можете задать функцию ядра, используя KernelFunction аргумент пары "имя-значение" в вызове fitrgp. Можно либо задать одну из встроенных опций параметра ядра, либо задать пользовательскую функцию. При предоставлении начальных значений параметров ядра для встроенной функции ядра вводите начальные значения для стандартного отклонения сигнала и шкал (шкал ) длины характеристики в качестве числового вектора. При предоставлении начальных значений параметров ядра для пользовательской функции ядра вводите начальные значения в вектор параметризации без ограничений θ. fitrgp использует аналитические производные для оценки параметров при использовании встроенной функции ядра, тогда как при использовании пользовательской функции ядра использует числовые производные.

Ссылки

[1] Расмуссен, К. Э. и К. К. И. Уильямс. Гауссовы процессы для машинного обучения. MIT Press. Кембридж, Массачусетс, 2006.

[2] Нил, Р. М. Байесиан Обучение для нейронных сетей. Спрингер, Нью-Йорк. Лекции по статистике, 118, 1996 год.

См. также

|

Похожие темы