mvksdensity

Оценка функции сглаживания ядра для многомерных данных

Синтаксис

f = mvksdensity(x,pts,'Bandwidth',bw)

f = mvksdensity(x,pts,'Bandwidth',bw,Name,Value)

Описание

f = mvksdensity(x,pts,'Bandwidth',bw) вычисляет оценку плотности вероятностей выборочных данных в матрице n -by d x, оцениваемый в точках в pts использование необходимого значения аргумента пары "имя-значение" bw для значения полосы пропускания. Оценка основана на продукте функции Гауссова ядра.

Для одномерных или двухмерных данных используйте ksdensity вместо этого.

пример

f = mvksdensity(x,pts,'Bandwidth',bw,Name,Value) возвращает любой из предыдущих выходных аргументов, используя дополнительные опции, заданные одним или несколькими Name,Value аргументы в виде пар. Для примера можно задать тип функции, которая mvksdensity оценивает, такой как плотность вероятностей, совокупная вероятность или функция выживания. Можно также присвоить веса входным значениям.

Примеры

свернуть все

Оценка многомерной плотности ядра

Открыть Live Script

Загрузите данные Hald цемента.

load hald

Данные измеряют теплоту затвердевания для 13 различных составов цемента. Матрица предикторов ingredients содержит процентную композицию для каждого из четырех ингредиентов цемента. Матрица отклика heat содержит тепло затвердевания (в кал\г) через 180 дней.

Оцените плотность ядра для первых трех наблюдений в ingredients.

xi = ingredients(1:3,:);
f = mvksdensity(ingredients,xi,'Bandwidth',0.8);

Оценка многомерной плотности ядра с помощью сеток

Открыть Live Script

Загрузите данные Hald цемента.

load hald

Создайте массив точек, в которых можно оценить плотность. Во-первых, задайте область значений и интервалы для каждой переменной, используя одинаковое число точек в каждой размерности.

gridx1 = 0:2:22;
gridx2 = 20:5:80;
gridx3 = 0:2:24;
gridx4 = 5:5:65;

Далее используйте ndgrid чтобы сгенерировать полную сетку точек с помощью заданной области значений и интервала.

[x1,x2,x3,x4] = ndgrid(gridx1,gridx2,gridx3,gridx4);

Наконец, преобразуйте и конкатенируйте, чтобы создать массив, который содержит точки, в которых можно оценить плотность. Этот массив имеет по одному столбцу для каждой переменной.

x1 = x1(:,:)';
x2 = x2(:,:)';
x3 = x3(:,:)';
x4 = x4(:,:)';
xi = [x1(:) x2(:) x3(:) x4(:)];

Оцените плотность.

f = mvksdensity(ingredients,xi,...
	'Bandwidth',[4.0579 10.7345 4.4185 11.5466],...
	'Kernel','normpdf');

Просмотрите размер xi и f чтобы подтвердить, что mvksdensity вычисляет плотность в каждой точке в xi.

size_xi = size(xi)

size_xi = 1×2

       26364           4

size_f = size(f)

size_f = 1×2

       26364           1

Входные параметры

свернуть все

`x` - Выборочные данные
числовая матрица

Выборочные данные, для которого mvksdensity возвращает оценку плотности вероятностей, заданную как n -by - d матрица числовых значений. n - количество точек данных (строк) в x, и d количество размерностей (столбцов).

Типы данных: single | double

`pts` - Точки, в которых можно оценить f
матрица

Точки, в которых можно вычислить оценку плотности вероятностей f, заданный как матрица с одинаковым числом столбцов, как x. Возвращенная оценка f и pts иметь одинаковое число строк.

Типы данных: single | double

`bw` - Значение полосы пропускания окна сглаживания ядра
скалярное значение | d вектор -элемент

Значение полосы пропускания окна сглаживания ядра, заданное как скалярное значение или d элемент. d - количество размерностей (столбцов) в выборочных данных x. Если bw является скалярным значением, оно применяется ко всем размерностям.

Если вы задаете 'BoundaryCorrection' как 'log'(по умолчанию) и 'Support' либо как 'positive' или матрица с двумя строками, mvksdensity преобразует ограниченные данные в неограниченные с помощью преобразования журнала. Значение bw находится в шкале преобразованных значений.

Правило большого пальца Сильвермана для полосы пропускания является

$b_{i} = σ_{i} {\frac{4}{(d + 2) n}}^{\frac{1}{(d + 4)}}, i = 1, 2, ..., d,$

где d - количество размерностей, n - количество наблюдений, и $σ_{i}$ - стандартное отклонение i^th варьируйте [4].

Пример: 'Bandwidth',0.8

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Kernel','triangle','Function,'cdf' задает, что mvksdensity оценивает cdf выборочных данных с помощью функции ядра треугольника.

`'BoundaryCorrection'` - Метод коррекции границ
'log' (по умолчанию) | 'reflection'

Метод коррекции границ, заданный как разделенная разделенными запятой парами, состоящая из 'BoundaryCorrection' и любой из них 'log' или 'reflection'.

Значение Описание

Значение	Описание
`'log'`	`mvksdensity` преобразует ограниченные данные в неограниченные с помощью одного из следующих преобразований. Затем он преобразуется назад к исходной ограниченной шкале после оценки плотности. Если вы задаете `'Support','positive'`, затем `mvksdensity` применяется `log`(_xj) для каждой размерности, где _xj является `j`1-й столбец входного параметра `x`. Если вы задаете `'Support'` в виде двухстрочной матрицы, состоящей из нижнего и верхнего пределов для каждой размерности, затем `mvksdensity` применяется `log`((_xj - Lj _)/( _Uj - xj)) для каждой размерности, _где Lj и Uj являются нижними и верхними пределами `j`е-е размерность, соответственно. Значение `bw` находится в шкале преобразованных значений.
`'reflection'`	`mvksdensity` увеличивает ограниченные данные путем добавления отраженных данных вблизи контуров, затем возвращает оценки, соответствующие исходной поддержке. Для получения дополнительной информации смотрите Метод отражения.

'log'

mvksdensity преобразует ограниченные данные в неограниченные с помощью одного из следующих преобразований. Затем он преобразуется назад к исходной ограниченной шкале после оценки плотности.

Если вы задаете 'Support','positive', затем mvksdensity применяется log(_xj) для каждой размерности, где _xj является j1-й столбец входного параметра x.
Если вы задаете 'Support' в виде двухстрочной матрицы, состоящей из нижнего и верхнего пределов для каждой размерности, затем mvksdensity применяется log((_xj - Lj _)/( _Uj - xj)) для каждой размерности, _где Lj и Uj являются нижними и верхними пределами jе-е размерность, соответственно.

Значение bw находится в шкале преобразованных значений.

'reflection'

mvksdensity увеличивает ограниченные данные путем добавления отраженных данных вблизи контуров, затем возвращает оценки, соответствующие исходной поддержке. Для получения дополнительной информации смотрите Метод отражения.

mvksdensity применяет коррекцию границ только при задании 'Support' как значение, отличное от 'unbounded'.

Пример: 'BoundaryCorrection','reflection'

`'Function'` - Функция для оценки
`'pdf'` (по умолчанию) | `'cdf'` | `'survivor'`

Функция для оценки, заданная как разделенная разделенными запятой парами, состоящая из 'Function' и одно из следующих.

Значение	Описание
`'pdf'`	Функция плотности вероятностей
`'cdf'`	Кумулятивная функция распределения
`'survivor'`	Функция выживания

Пример: 'Function', 'cdf'

`'Kernel'` - Тип более плавного ядра
`'normal'` (по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | указатель на функцию | вектор символов | строковый скаляр

Тип гладкого ядра, заданный как разделенная разделенными запятой парами, состоящая из 'Kernel' и одно из следующих.

Значение	Описание
`'normal'`	Нормальное (Гауссово) ядро
`'box'`	Ядро коробки
`'triangle'`	Треугольное ядро
`'epanechnikov'`	Ядро Эпанечникова

Можно также задать функцию ядра, которая является пользовательской или встроенной функцией. Задайте функцию как указатель на функцию (для примера, @myfunction или @normpdf) или как вектор символов или строковый скаляр (для примера, 'myfunction' или 'normpdf'). Программа вызывает указанную функцию с одним аргументом, который является массивом расстояний между значениями данных и местоположениями, где оценивается плотность, нормированная по ширине полосы пропускания в этой размерности. Функция должна вернуть массив того же размера, содержащий соответствующие значения функции ядра.

mvksdensity применяет одно и то же ядро к каждой размерности.

Пример: 'Kernel','box'

`'Support'` - Поддержка плотности
`'unbounded'` (по умолчанию) | `'positive'` | матрицу 2 d байта

Поддержка плотности, заданная как разделенная разделенными запятой парами, состоящая из 'support' и одно из следующих.

Значение	Описание
`'unbounded'`	Позволять плотности простираться по всей действительной линии
`'positive'`	Ограничьте плотность положительными значениями
2-by- d матрица	Задайте конечные нижнюю и верхнюю границы для поддержки плотности. Первая строка содержит нижние пределы, а вторая - верхние пределы. Каждый столбец содержит пределы для одной размерности `x`.

'Support' может также быть комбинацией положительных, неограниченных и ограниченных переменных, заданных как [0 -Inf L; Inf Inf U].

Пример: 'Support','positive'

Типы данных: single | double | char | string

`'Weights'` - Веса для выборочных данных
вектор

Веса для выборочных данных, заданные как разделенная разделенными запятой парами, состоящая из 'Weights' и вектор длины size(x,1), где x является выборочными данными.

Пример: 'Weights',xw

Типы данных: single | double

Выходные аргументы

свернуть все

`f` - Предполагаемые значения функций
вектор

Предполагаемые значения функции, возвращенные как вектор. f и pts иметь одинаковое число строк.

Подробнее о

свернуть все

Многомерное ядерное распределение

Многомерное ядерное распределение является непараметрическим представлением функции плотности вероятностей (pdf) случайного вектора. Можно использовать ядерное распределение, когда параметрическое распределение не может правильно описать данные, или когда вы хотите избежать допущений о распределении данных. Многомерное ядерное распределение определяется функцией сглаживания и матрицей полосы пропускания, которые управляют плавностью полученной кривой плотности.

Многомерная оценка плотности ядра является оценочным PDF для случайного вектора. Предположим x = (_x1, _x2,..., _xd) '- d -мерный случайный вектор с функцией плотности f а yi = _(yi1, _yi2,..._, yid)' - случайная выборка, полученная из f для i = 1, 2,..., n, где n - количество случайных выборок. Для любых векторов действительных чисел x, многомерная оценка плотности ядра задается как

${\hat{f}}_{H} (x) = \frac{1}{n} \sum_{i = 1}^{n} K_{H} (x - y_{i}),$

где $K_{H} (x) = {| H |}^{- 1 / 2} K (H^{- 1 / 2} x)$ , $K (\cdot)$ является функцией сглаживания ядра, и H является матрицей d -by d bandwidth .

mvksdensity использует диагональную матрицу пропускной способности и ядро продукта. То есть H^1/2 является квадратной диагональной матрицей с элементами вектора (_h1, _h2,..., _hd) на основной диагонали. K(x) берет форму <reservedrangesplaceholder6> продукта = k (<reservedrangesplaceholder4>) k (<reservedrangesplaceholder2>) <reservedrangesplaceholder1> (<reservedrangesplaceholder0>), где $k (\cdot)$ является одномерной функцией сглаживания ядра. Затем многомерная оценка плотности ядра становится

${\hat{f}}_{H} (x) = \frac{1}{n} \sum_{i = 1}^{n} K_{H} (x - y_{i}) = \frac{1}{n h_{1} h_{2} \dots h_{d}} \sum_{i = 1}^{n} K (\frac{x_{1} - y_{i 1}}{h_{1}}, \frac{x_{2} - y_{i 2}}{h_{2}}, \dots, \frac{x_{d} - y_{i d}}{h_{d}}) = \frac{1}{n h_{1} h_{2} \dots h_{d}} \sum_{i = 1}^{n} \prod_{j = 1}^{d} k (\frac{x_{j} - y_{i j}}{h_{j}}) .$

Оценка ядра для кумулятивной функции распределения (cdf), для любых векторов действительных чисел x, задается как

${\hat{F}}_{H} (x) = \int_{- \infty}^{x_{1}} \int_{- \infty}^{x_{2}} \dots \int_{- \infty}^{x_{d}} {\hat{f}}_{H} (t) d t_{d} \dots d t_{2} d t_{1} = \frac{1}{n} \sum_{i = 1}^{n} \prod_{j = 1}^{d} G (\frac{x_{j} - y_{i j}}{h_{j}}),$

где $G (x_{j}) = \int_{- \infty}^{x_{j}} k (t_{j}) d t_{j}$ .

Метод отражения

Метод отражения является краевым методом коррекции, который точно находит оценки плотности ядра, когда случайная переменная имеет ограниченную поддержку. Если вы задаете 'BoundaryCorrection','reflection', mvksdensity использует метод отражения.

Если вы дополнительно задаете 'Support' в виде двухстрочной матрицы, состоящей из нижнего и верхнего пределов для каждой размерности, затем mvksdensity находит оценщик ядра следующим образом.

Если 'Function' является 'pdf', тогда оценка плотности ядра
${\hat{f}}_{H} (x) = \frac{1}{n h_{1} h_{2} \dots h_{d}} \sum_{i = 1}^{n} \prod_{j = 1}^{d} [k (\frac{x_{j} - y_{i j}^{-}}{h_{j}}) + k (\frac{x_{j} - y_{i j}}{h_{j}}) + k (\frac{x_{j} - y_{i j}^{+}}{h_{j}})]$ для _{<reservedrangesplaceholder2> ≤ <reservedrangesplaceholder1> ≤ <reservedrangesplaceholder0>} ,
где $y_{i j}^{-} = 2 L_{j} - y_{i j}$ , $y_{i j}^{+} = 2 U_{j} - y_{i j}$ , и _yij является jпервый элемент ith выборочных данных, соответствующий x(i,j) от входного параметра x. _Lj и _Uj являются нижним и верхним пределами jе-е размерность, соответственно.
Если 'Function' является 'cdf', тогда оценка ядра для cdf является
${\hat{F}}_{H} (x) = \frac{1}{n} \sum_{i = 1}^{n} \prod_{j = 1}^{d} [G (\frac{x_{j} - y_{i j}^{-}}{h_{j}}) + G (\frac{x_{j} - y_{i j}}{h_{j}}) + G (\frac{x_{j} - y_{i j}^{+}}{h_{j}}) - G (\frac{L_{j} - y_{i j}^{-}}{h_{j}}) - G (\frac{L_{j} - y_{i j}}{h_{j}}) - G (\frac{L_{j} - y_{i j}^{+}}{h_{j}})]$ для _{<reservedrangesplaceholder2> ≤ <reservedrangesplaceholder1> ≤ <reservedrangesplaceholder0>} .
Чтобы получить оценку ядра для функции выживания (когда 'Function' является 'survivor'), mvksdensity использует оба ${\hat{f}}_{H} (x)$ и ${\hat{F}}_{H} (x)$ .

Если вы дополнительно задаете 'Support' как 'positive' или матрица, включающая [0 inf], затем mvksdensity находит оценку плотности ядра путем замены _{[Lj Uj]} с [0 inf] в вышеприведенных уравнениях.

Ссылки

[1] Боуман, А. У. и А. Аззалини. Примененные методы сглаживания для анализа данных. Нью-Йорк: Oxford University Press Inc., 1997.

[2] Hill, P.D. «Kernel estimation of a distribution function». Коммуникации в статистике - теория и методы. Том 14, Выпуск 3, 1985, стр. 605-620.

[3] Jones, M. C. «Простая краевая коррекция для оценки плотности ядра». Статистика и вычисления. Том 3, Выпуск 3, 1993, стр. 135-146.

[4] Сильверман, B. W. Оценка плотности для статистики и анализа данных. Chapman & Hall/CRC, 1986.

[5] Скотт, Д. В. Многомерная оценка плотности: теория, практика и визуализация. John Wiley & Sons, 2015.

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Указания и ограничения по применению:

Имена в аргументах пары "имя-значение", включая 'Bandwidth', должны быть постоянными во время компиляции.
Значения в следующих аргументах пары "имя-значение" также должны быть константами во время компиляции: 'BoundaryCorrection', 'Function', и 'Kernel'. Например, чтобы использовать 'Function','cdf' Аргумент пары "имя-значение" в сгенерированный код включите {coder.Constant('Function'),coder.Constant('cdf')} в -args значение codegen.
Значение 'Kernel' Аргумент пары "имя-значение" не может быть пользовательским указателем на функцию. Чтобы задать пользовательскую функцию ядра, используйте вектор символов или строковый скаляр.
Для значения 'Support' аргумент пары "имя-значение", тип данных во время компиляции должен совпадать с типом данных во время выполнения.

Для получения дополнительной информации о генерации кода смотрите Введение в генерацию кода и Рабочий процесс генерации общего кода.

См. также

ksdensity

Темы

Введенный в R2016a

Документация

mvksdensity

Синтаксис

Описание

Примеры

Оценка многомерной плотности ядра

Оценка многомерной плотности ядра с помощью сеток

Входные параметры

`x` - Выборочные данные
числовая матрица

`pts` - Точки, в которых можно оценить f
матрица

`bw` - Значение полосы пропускания окна сглаживания ядра
скалярное значение | d вектор -элемент

Аргументы в виде пар имя-значение

`'BoundaryCorrection'` - Метод коррекции границ
'log' (по умолчанию) | 'reflection'

`'Function'` - Функция для оценки
`'pdf'` (по умолчанию) | `'cdf'` | `'survivor'`

`'Kernel'` - Тип более плавного ядра
`'normal'` (по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | указатель на функцию | вектор символов | строковый скаляр

`'Support'` - Поддержка плотности
`'unbounded'` (по умолчанию) | `'positive'` | матрицу 2 d байта

`'Weights'` - Веса для выборочных данных
вектор

Выходные аргументы

`f` - Предполагаемые значения функций
вектор

Подробнее о

Многомерное ядерное распределение

Метод отражения

Ссылки

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

См. также

Темы

Statistics and Machine Learning Toolbox документация

Поддержка

Документация

mvksdensity

Синтаксис

Описание

Примеры

Оценка многомерной плотности ядра

Оценка многомерной плотности ядра с помощью сеток

Входные параметры

x - Выборочные данные числовая матрица

pts - Точки, в которых можно оценить f матрица

bw - Значение полосы пропускания окна сглаживания ядра скалярное значение | d вектор -элемент

Аргументы в виде пар имя-значение

'BoundaryCorrection' - Метод коррекции границ 'log' (по умолчанию) | 'reflection'

'Function' - Функция для оценки 'pdf' (по умолчанию) | 'cdf' | 'survivor'

'Kernel' - Тип более плавного ядра 'normal' (по умолчанию) | 'box' | 'triangle' | 'epanechnikov' | указатель на функцию | вектор символов | строковый скаляр

'Support' - Поддержка плотности 'unbounded' (по умолчанию) | 'positive' | матрицу 2 d байта

'Weights' - Веса для выборочных данных вектор

Выходные аргументы

f - Предполагаемые значения функций вектор

Подробнее о

Многомерное ядерное распределение

Метод отражения

Ссылки

Расширенные возможности

Генерация кода C/C + + Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

См. также

Темы

Statistics and Machine Learning Toolbox документация

Поддержка

`x` - Выборочные данные
числовая матрица

`pts` - Точки, в которых можно оценить f
матрица

`bw` - Значение полосы пропускания окна сглаживания ядра
скалярное значение | d вектор -элемент

`'BoundaryCorrection'` - Метод коррекции границ
'log' (по умолчанию) | 'reflection'

`'Function'` - Функция для оценки
`'pdf'` (по умолчанию) | `'cdf'` | `'survivor'`

`'Kernel'` - Тип более плавного ядра
`'normal'` (по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | указатель на функцию | вектор символов | строковый скаляр

`'Support'` - Поддержка плотности
`'unbounded'` (по умолчанию) | `'positive'` | матрицу 2 d байта

`'Weights'` - Веса для выборочных данных
вектор

`f` - Предполагаемые значения функций
вектор

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®