Подмножество приближения данных для моделей GPR

Настройка модели GPR с помощью точного метода (когда FitMethod является 'Exact') требует инверсии матрицы n -by n. Поэтому вычислительная сложность является O (k n3), где k количество вычислений функции, необходимых для оценки β, θ, и σ2, и n количество наблюдений. Для больших n оценка параметров или вычислительные предсказания могут быть очень дорогими.

Одним из простых способов решения задачи вычислительной сложности с большими наборами данных является выбор m < n наблюдений из n, а затем применение точной модели GPR к этим m точкам для оценки β, θ, и σ2 игнорируя другие (n - m) точки. Это меньшее подмножество известно как активное множество. И этот метод приближения называется методом Subset of Data (SD).

Вычислительная сложность при использовании SD метода - O (k m3), где k количество вычислений функции, а m - размер активного набора. Требования к хранению: O (m2) так как только часть полной матрицы ядра K(X,X|θ) должна храниться в памяти.

Можно задать метод SD для оценки параметра при помощи 'FitMethod','sd' аргумент пары "имя-значение" в вызове fitrgp. Чтобы задать метод SD для предсказания, используйте 'PredictMethod','sd' аргумент пары "имя-значение".

Для оценки параметров с использованием точной модели GPR, смотрите оценку параметра с помощью точного метода GPR. Для составления предсказаний с использованием точной модели GPR, смотрите предсказание с использованием точного метода GPR.

См. также

|

Похожие темы