mvksdensity

Оценка функции сглаживания ядра для многомерных данных

Синтаксис

f = mvksdensity (x, pts, 'Полоса пропускания', bw)

f = mvksdensity (x, pts, 'Полоса пропускания', bw, Имя, Значение)

Описание

f = mvksdensity(x,pts,'Bandwidth',bw) вычисляет оценку плотности вероятности данных выборки в матрице n-by-d x, оценивается в точках в pts использование требуемого значения аргумента пара имя-значение bw для значения полосы пропускания. Оценка основана на функции гауссова ядра продукта.

Для одномерных или двухмерных данных используйте ksdensity вместо этого.

пример

f = mvksdensity(x,pts,'Bandwidth',bw,Name,Value) возвращает любой из предыдущих выходных аргументов, используя дополнительные параметры, указанные одним или несколькими Name,Value аргументы пары. Например, можно определить тип функции, mvksdensity оценивает, например, плотность вероятности, кумулятивную вероятность или функцию выжившего. Также можно назначить веса входным значениям.

Примеры

свернуть все

Оценка многомерной плотности ядра

Открыть сценарий в реальном времени

Загрузите данные цемента Hald.

load hald

Данные измеряют теплоту отверждения для 13 различных составов цемента. Матрица предиктора ingredients содержит процентную композицию для каждого из четырех компонентов цемента. Матрица ответа heat содержит тепло отверждения (в кал\г) через 180 дней.

Оценка плотности ядра для первых трех наблюдений в ingredients.

xi = ingredients(1:3,:);
f = mvksdensity(ingredients,xi,'Bandwidth',0.8);

Оценка многомерной плотности ядра с помощью сеток

Открыть сценарий в реальном времени

Загрузите данные цемента Hald.

load hald

Создайте массив точек для оценки плотности. Сначала определите диапазон и интервал для каждой переменной, используя одинаковое количество точек в каждом измерении.

gridx1 = 0:2:22;
gridx2 = 20:5:80;
gridx3 = 0:2:24;
gridx4 = 5:5:65;

Далее используйте ndgrid для создания полной сетки точек с использованием определенного диапазона и интервала.

[x1,x2,x3,x4] = ndgrid(gridx1,gridx2,gridx3,gridx4);

Наконец, выполните преобразование и конкатенацию для создания массива, содержащего точки для оценки плотности. Этот массив содержит по одному столбцу для каждой переменной.

x1 = x1(:,:)';
x2 = x2(:,:)';
x3 = x3(:,:)';
x4 = x4(:,:)';
xi = [x1(:) x2(:) x3(:) x4(:)];

Оцените плотность.

f = mvksdensity(ingredients,xi,...
	'Bandwidth',[4.0579 10.7345 4.4185 11.5466],...
	'Kernel','normpdf');

Просмотр размера xi и f подтвердить, что mvksdensity вычисляет плотность в каждой точке в xi.

size_xi = size(xi)

size_xi = 1×2

       26364           4

size_f = size(f)

size_f = 1×2

       26364           1

Входные аргументы

свернуть все

`x` - Образцы данных
числовая матрица

Образец данных, для которых mvksdensity возвращает оценку плотности вероятности, заданную как матрица n-на-d числовых значений. n - количество точек данных (строк) в x, и d - количество размеров (столбцов).

Типы данных: single | double

`pts` - Точки для оценки f
матрица

Точки, в которых оценивается оценка плотности вероятности f, указанный как матрица с тем же количеством столбцов, что и x. Возвращенная оценка f и pts имеют одинаковое количество строк.

Типы данных: single | double

`bw` - Значение полосы пропускания окна сглаживания ядра
скалярное значение | вектор d-элемента

Значение полосы пропускания окна сглаживания ядра, указанное как скалярное значение или вектор d-элемента. d - количество измерений (столбцов) в данных образца; x. Если bw является скалярным значением, оно применяется ко всем измерениям.

При указании 'BoundaryCorrection' как 'log'(по умолчанию) и 'Support' как либо 'positive' или двухстрочная матрица, mvksdensity преобразует ограниченные данные в неограниченные с помощью преобразования журнала. Значение bw находится в масштабе преобразованных значений.

Правило Сильвермана для полосы пропускания

$_{bi} =_{} {\frac{starti}{{4 (d}}^{\frac{+}{2) n}}} 1 (d + 4), i$ = 1,2,..., d,

где d - количество размеров, n - количество наблюдений, и $_{σi}$ - стандартное отклонение ith варьируемой величины [4].

Пример: 'Bandwidth',0.8

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Kernel','triangle','Function,'cdf' указывает, что mvksdensity оценивает cdf данных выборки, используя функцию ядра треугольника.

`'BoundaryCorrection'` - Метод коррекции границ
'log' (по умолчанию) | 'reflection'

Метод коррекции границы, указанный как разделенная запятыми пара, состоящая из 'BoundaryCorrection' и либо 'log' или 'reflection'.

Стоимость Описание

Стоимость	Описание
`'log'`	`mvksdensity` преобразует ограниченные данные в неограниченные с помощью одного из следующих преобразований. Затем он преобразуется обратно в исходную ограниченную шкалу после оценки плотности. При указании `'Support','positive'`, то `mvksdensity` применяется `log`(_xj) для каждого размера, где _{xj -} `j`третий столбец входного аргумента `x`. При указании `'Support'` в виде двухстрочной матрицы, состоящей из нижнего и верхнего пределов для каждого измерения, `mvksdensity` применяется `log`((_xj-Lj )/( _Uj-xj)) для каждого размера, где Lj и Uj - нижний и верхний пределы `j`-е измерение, соответственно. Значение `bw` находится в масштабе преобразованных значений.
`'reflection'`	`mvksdensity` увеличивает ограниченные данные путем добавления отраженных данных вблизи границ, затем возвращает оценки, соответствующие исходной поддержке. Дополнительные сведения см. в разделе Метод отражения.

'log'

mvksdensity преобразует ограниченные данные в неограниченные с помощью одного из следующих преобразований. Затем он преобразуется обратно в исходную ограниченную шкалу после оценки плотности.

При указании 'Support','positive', то mvksdensity применяется log(_xj) для каждого размера, где _{xj -} jтретий столбец входного аргумента x.
При указании 'Support' в виде двухстрочной матрицы, состоящей из нижнего и верхнего пределов для каждого измерения, mvksdensity применяется log((_xj-Lj )/( _Uj-xj)) для каждого размера, где Lj и Uj - нижний и верхний пределы j-е измерение, соответственно.

Значение bw находится в масштабе преобразованных значений.

'reflection'

mvksdensity увеличивает ограниченные данные путем добавления отраженных данных вблизи границ, затем возвращает оценки, соответствующие исходной поддержке. Дополнительные сведения см. в разделе Метод отражения.

mvksdensity применяет коррекцию границ только при указании 'Support' как значение, отличное от 'unbounded'.

Пример: 'BoundaryCorrection','reflection'

`'Function'` - Функция для оценки
`'pdf'` (по умолчанию) | `'cdf'` | `'survivor'`

Функция для оценки, указанная как разделенная запятыми пара, состоящая из 'Function' и одно из следующих.

Стоимость	Описание
`'pdf'`	Функция плотности вероятности
`'cdf'`	Кумулятивная функция распределения
`'survivor'`	Функция выжившего

Пример: 'Function','cdf'

`'Kernel'` - Тип ядра более гладкий
`'normal'` (по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | дескриптор функции | вектор символов | скаляр строки

Тип более гладкого ядра, указанный как разделенная запятыми пара, состоящая из 'Kernel' и одно из следующих.

Стоимость	Описание
`'normal'`	Нормальное (гауссово) ядро
`'box'`	Ядро коробки
`'triangle'`	Треугольное ядро
`'epanechnikov'`	Ядро Епанечникова

Можно также указать функцию ядра, которая является пользовательской или встроенной функцией. Укажите функцию как дескриптор функции (например, @myfunction или @normpdf) или в виде вектора символа или скаляра строки (например, 'myfunction' или 'normpdf'). Программа вызывает указанную функцию с одним аргументом, который является массивом расстояний между значениями данных и местоположениями, где вычисляется плотность, нормируемая полосой пропускания в этом измерении. Функция должна возвращать массив того же размера, содержащий соответствующие значения функции ядра.

mvksdensity применяет одно и то же ядро к каждому измерению.

Пример: 'Kernel','box'

`'Support'` - Поддержка плотности
`'unbounded'` (по умолчанию) | `'positive'` | матрица 2 на d

Поддержка плотности, определяемой как разделенная запятыми пара, состоящая из 'support' и одно из следующих.

Стоимость	Описание
`'unbounded'`	Позволить плотности простираться по всей реальной линии
`'positive'`	Ограничить плотность положительными значениями
Матрица 2 на d	Задайте конечную нижнюю и верхнюю границы для опоры плотности. Первая строка содержит нижние пределы, а вторая строка содержит верхние пределы. Каждый столбец содержит пределы для одного измерения `x`.

'Support' также может быть комбинацией положительных, неограниченных и ограниченных переменных, указанных как [0 -Inf L; Inf Inf U].

Пример: 'Support','positive'

Типы данных: single | double | char | string

`'Weights'` - Веса для выборочных данных
вектор

Веса для данных выборки, указанные как разделенная запятыми пара, состоящая из 'Weights' и вектор длины size(x,1), где x - образец данных.

Пример: 'Weights',xw

Типы данных: single | double

Выходные аргументы

свернуть все

`f` - Оценочные значения функций
вектор

Расчетные значения функции, возвращаемые в виде вектора. f и pts имеют одинаковое количество строк.

Подробнее

свернуть все

Многомерное распространение ядра

Многомерное распределение ядра - непараметрическое представление функции плотности вероятности (pdf) случайного вектора. Распределение ядра можно использовать в тех случаях, когда параметрическое распределение не может правильно описать данные или когда необходимо избежать предположений о распределении данных. Многомерное распределение ядра определяется функцией сглаживания и матрицей полосы пропускания, которые управляют сглаживанием результирующей кривой плотности.

Многомерный оценщик плотности ядра - это оценочный pdf случайного вектора. Пусть x = (_x1, _x2,..., _xd) '- d-мерный случайный вектор с функцией плотности f и пусть _yi = (_yi1, _yi2,..., _yid)' - случайная выборка, взятая из f для i = 1, 2,..., n, где n - число случайных выборок. Для любых действительных векторов x многомерный оценщик плотности ядра задается как

${\overset{}{f}}_{^} H (\frac{x}{)}_{}^{}_{} {=1n∑i=1nKH}_{} (x$ − yi),

где $_{KH} (x) =^{| H} | -^{} 1/2K$ (H $-$ 1/2x), K (·) - функция сглаживания ядра, а H - матрица d-by-d полосы пропускания.

mvksdensity использует матрицу диагональной полосы пропускания и ядро продукта. То есть ^H1/2 - квадратная диагональная матрица с элементами вектора (_h1, _h2,..., _hd) на главной диагонали. K (x) принимает форму продукта K (x ) = _k (x1₎ k (x2₎ ⋯k (xd), где k (·) - одномерная функция сглаживания ядра. Затем многомерный модуль оценки плотности ядра становится

${\overset{}{f}}_{^} H (\frac{x}{)}_{}^{}_{} {=1n∑i=1nKH}_{} (x \frac{}{-_{} {yi}_{)}_{}}_{}^{} \frac{_{}_{}}{{=1nh1h2⋯hd∑i=1nK}_{}} (\frac{_{}_{}}{_{}} \frac{_{}_{}}{_{}} \frac{}{_{}_{} x1-yi1h1,x2-yi2h2,\dots,xd-yidhd)_{}}_{}^{}_{}^{} \frac{_{}_{}}{_{}} =1nh1h2\dotshd\sumi=1n\prodj=1dk$ (xj − yijhj).

Оценщик ядра для кумулятивной функции распределения (cdf) для любых действительных векторов x задается как

${\overset{}{F}}_{^} H (x_{)}^{_{}}_{}^{_{}}_{}^{_{}} {\overset{}{}}_{} =∫−∞x1∫−∞x2⋯∫−∞xdf^H_{(} t)_{}_{} \frac{}{}_{}^{}_{}^{} \frac{_{}_{dtd⋯dt2dt1=1n∑i=1n∏j=1dG}}{(_{}} xj -$ yijhj),

где $G (_{} xj)_{}^{_{}} {=∫−∞xjk}_{} ({tj}_{)}$ dtj.

Метод отражения

Метод отражения - это метод коррекции границ, который точно находит оценки плотности ядра, когда случайная величина имеет ограниченную поддержку. При указании 'BoundaryCorrection','reflection', mvksdensity использует метод отражения.

Если дополнительно указать 'Support' в виде двухстрочной матрицы, состоящей из нижнего и верхнего пределов для каждого измерения, mvksdensity находит оценщик ядра следующим образом.

Если 'Function' является 'pdf', то оценщиком плотности ядра является
${\overset{}{f}}_{^} H (\frac{x}{)_{}_{}_{}}_{}^{}_{}^{} \frac{_{} =1nh1h2\dotshd\sumi=1n\prodj=1d[k_{(}^{xj}}{_{-}} yij \frac{_{-}_{hj)}}{_{+}} k (\frac{_{xj} -_{}^{}}{_{}} yijhj)$ + k (_xj − _yij + hj)] для Lj ≤ xj ≤ Uj,
где $_{yij}^{} - =_{}_{2Lj}$ − $_{yij}^{,}_{yij} +_{=}$ 2Uj − _yij, и yij -j-й элемент iДанные выборки, соответствующие x(i,j) входного аргумента x. _Lj и _Uj - нижний и верхний пределы j-е измерение, соответственно.
Если 'Function' является 'cdf', то оценщиком ядра для cdf является
${\overset{}{F}}_{^} H (\frac{x}{)}_{}^{}_{}^{} \frac{_{} =1n\sumi=1n\prodj=1d[G_{(}^{xj}}{_{-}} yij \frac{_{-}_{hj)}}{_{+}} G (\frac{_{xj} -_{}^{}}{_{}} yijhj) + \frac{_{G} (_{xj}^{}}{-_{}} yij \frac{+_{} {hj}_{)}}{-_{}} G (\frac{{Lj}_{} -_{}^{yijhj)}}{_{}}$ − G (Lj − yijhj) − G (Lj − yij + hj)] для Lj ≤ xj ≤ Uj.
Получение оценки ядра для функции выжившего (когда 'Function' является 'survivor'), mvksdensity использует как ${\overset{}{f}}_{^} H$ (x), так ${\overset{и}{}}_{} F^$ H (x).

Если дополнительно указать 'Support' как 'positive' или матрица, включающая [0 inf], то mvksdensity находит оценщик плотности ядра путем замены [L_j U_j] с [0 inf] в вышеприведенных уравнениях.

Ссылки

[1] Боуман, А. У. и А. Аззалини. Применяемые методы сглаживания для анализа данных. Нью-Йорк: Oxford University Press Inc., 1997.

[2] Хилл, П. Д. «Оценка ядра функции распределения». Коммуникации в статистике - теория и методы. Том 14, выпуск 3, 1985, стр. 605-620.

[3] Джонс, М. С. «Простая коррекция границ для оценки плотности ядра». Статистика и вычисления. Том 3, выпуск 3, 1993, стр. 135-146.

[4] Сильверман, В. В. Оценка плотности для статистики и анализа данных. Chapman & Hall/CRC, 1986.

[5] Скотт, Д. В. Многомерная оценка плотности: теория, практика и визуализация. Джон Уайли и сыновья, 2015.

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Примечания и ограничения по использованию:

Имена в аргументах пары имя-значение, включая 'Bandwidth', должны быть константами времени компиляции.
Значения в следующих аргументах пары имя-значение также должны быть константами времени компиляции: 'BoundaryCorrection', 'Function', и 'Kernel'. Например, для использования 'Function','cdf' аргумент пары имя-значение в сгенерированном коде, включить {coder.Constant('Function'),coder.Constant('cdf')} в -args значение codegen.
Значение 'Kernel' аргумент пары имя-значение не может быть пользовательским дескриптором функции. Чтобы задать пользовательскую функцию ядра, используйте вектор символов или скаляр строки.
Для значения 'Support' аргумент пары имя-значение, тип данных compile-time должен соответствовать типу данных среды выполнения.

Дополнительные сведения о создании кода см. в разделах Введение в создание кода и Общий рабочий процесс создания кода.

См. также

ksdensity

Темы

Представлен в R2016a

Документация

mvksdensity

Синтаксис

Описание

Примеры

Оценка многомерной плотности ядра

Оценка многомерной плотности ядра с помощью сеток

Входные аргументы

`x` - Образцы данных
числовая матрица

`pts` - Точки для оценки f
матрица

`bw` - Значение полосы пропускания окна сглаживания ядра
скалярное значение | вектор d-элемента

Аргументы пары «имя-значение»

`'BoundaryCorrection'` - Метод коррекции границ
'log' (по умолчанию) | 'reflection'

`'Function'` - Функция для оценки
`'pdf'` (по умолчанию) | `'cdf'` | `'survivor'`

`'Kernel'` - Тип ядра более гладкий
`'normal'` (по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | дескриптор функции | вектор символов | скаляр строки

`'Support'` - Поддержка плотности
`'unbounded'` (по умолчанию) | `'positive'` | матрица 2 на d

`'Weights'` - Веса для выборочных данных
вектор

Выходные аргументы

`f` - Оценочные значения функций
вектор

Подробнее

Многомерное распространение ядра

Метод отражения

Ссылки

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

Документация

mvksdensity

Синтаксис

Описание

Примеры

Оценка многомерной плотности ядра

Оценка многомерной плотности ядра с помощью сеток

Входные аргументы

x - Образцы данных числовая матрица

pts - Точки для оценки f матрица

bw - Значение полосы пропускания окна сглаживания ядра скалярное значение | вектор d-элемента

Аргументы пары «имя-значение»

'BoundaryCorrection' - Метод коррекции границ 'log' (по умолчанию) | 'reflection'

'Function' - Функция для оценки 'pdf' (по умолчанию) | 'cdf' | 'survivor'

'Kernel' - Тип ядра более гладкий 'normal' (по умолчанию) | 'box' | 'triangle' | 'epanechnikov' | дескриптор функции | вектор символов | скаляр строки

'Support' - Поддержка плотности 'unbounded' (по умолчанию) | 'positive' | матрица 2 на d

'Weights' - Веса для выборочных данных вектор

Выходные аргументы

f - Оценочные значения функций вектор

Подробнее

Многомерное распространение ядра

Метод отражения

Ссылки

Расширенные возможности

Создание кода C/C + + Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

`x` - Образцы данных
числовая матрица

`pts` - Точки для оценки f
матрица

`bw` - Значение полосы пропускания окна сглаживания ядра
скалярное значение | вектор d-элемента

`'BoundaryCorrection'` - Метод коррекции границ
'log' (по умолчанию) | 'reflection'

`'Function'` - Функция для оценки
`'pdf'` (по умолчанию) | `'cdf'` | `'survivor'`

`'Kernel'` - Тип ядра более гладкий
`'normal'` (по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | дескриптор функции | вектор символов | скаляр строки

`'Support'` - Поддержка плотности
`'unbounded'` (по умолчанию) | `'positive'` | матрица 2 на d

`'Weights'` - Веса для выборочных данных
вектор

`f` - Оценочные значения функций
вектор

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™