mvksdensity

Ядро, сглаживающее функциональную оценку для многомерных данных

Синтаксис

f = mvksdensity(x,pts,'Bandwidth',bw)

f = mvksdensity(x,pts,'Bandwidth',bw,Name,Value)

Описание

f = mvksdensity(x,pts,'Bandwidth',bw) вычисляет оценку плотности вероятности выборочных данных в n-by-d матричный x, оцененный в точках в pts использование необходимого значения аргумента пары "имя-значение" bw для значения пропускной способности. Оценка основана на продукте Гауссова функция ядра.

Для одномерных или двумерных данных использовать ksdensity вместо этого.

пример

f = mvksdensity(x,pts,'Bandwidth',bw,Name,Value) возвращает любой из предыдущих выходных аргументов, с помощью дополнительных опций, заданных одним или несколькими Name,Value парные аргументы. Например, можно задать функциональный тип это mvksdensity оценивает, такие как плотность вероятности, интегральная вероятность или функция оставшегося в живых. Можно также присвоить веса входным значениям.

Примеры

свернуть все

Оцените многомерную плотность ядра

Попробовать в MATLAB

Загрузите цементные данные Hald.

load hald

Данные измеряют тепло укрепления для 13 различных цементных составов. Матрица предиктора ingredients содержит состав процента для каждого из четырех цементных компонентов. Матрица ответа heat содержит тепло укрепления (в cal\g) после 180 дней.

Оцените плотность ядра для первых трех наблюдений в ingredients.

xi = ingredients(1:3,:);
f = mvksdensity(ingredients,xi,'Bandwidth',0.8);

Оцените многомерную плотность ядра Используя сетки

Попробовать в MATLAB

Загрузите цементные данные Hald.

load hald

Создайте массив точек, в которых можно оценить плотность. Во-первых, задайте область значений и располагающий с интервалами для каждой переменной, с помощью подобного числа точек в каждой размерности.

gridx1 = 0:2:22;
gridx2 = 20:5:80;
gridx3 = 0:2:24;
gridx4 = 5:5:65;

Затем используйте ndgrid сгенерировать полную сетку точек с помощью заданной области значений и интервала.

[x1,x2,x3,x4] = ndgrid(gridx1,gridx2,gridx3,gridx4);

Наконец, преобразуйте и конкатенируйте, чтобы создать массив, который содержит точки, в которых можно оценить плотность. Этот массив имеет один столбец для каждой переменной.

x1 = x1(:,:)';
x2 = x2(:,:)';
x3 = x3(:,:)';
x4 = x4(:,:)';
xi = [x1(:) x2(:) x3(:) x4(:)];

Оцените плотность.

f = mvksdensity(ingredients,xi,...
	'Bandwidth',[4.0579 10.7345 4.4185 11.5466],...
	'Kernel','normpdf');

Просмотрите размер xi и f подтвердить тот mvksdensity вычисляет плотность в каждой точке в xi.

size_xi = size(xi)

size_xi = 1×2

       26364           4

size_f = size(f)

size_f = 1×2

       26364           1

Входные параметры

свернуть все

`x` — Выборочные данные
числовая матрица

Выборочные данные, для который mvksdensity возвращает оценку плотности вероятности в виде n-by-d матрица числовых значений. n является количеством точек данных (строки) в x, и d является количеством размерностей (столбцы).

Типы данных: single | double

`pts` — Точки, в которых можно оценить f
матрица

Точки, в которых можно оценить плотность вероятности, оценивают fВ виде матрицы с одинаковым числом столбцов как x. Возвращенная оценка f и pts имейте одинаковое число строк.

Типы данных: single | double

`bw` — Значение для пропускной способности окна сглаживания ядра
скалярное значение | d - вектор элемента

Значение для пропускной способности сглаживающего ядро окна в виде скалярного значения или d - вектор элемента. d является количеством размерностей (столбцы) в выборочных данных x. Если bw скалярное значение, оно применяется ко всем размерностям.

Если вы задаете 'BoundaryCorrection' как 'log'(значение по умолчанию) и 'Support' как любой 'positive' или матрица 2D строки, mvksdensity преобразует ограниченные данные, чтобы быть неограниченным при помощи логарифмического преобразования. Значение bw находится по шкале преобразованных значений.

Эмпирическое правило Сильвермана для пропускной способности

$b_{i} = σ_{i} {\frac{4}{(d + 2) n}}^{\frac{1}{(d + 4)}}, i = 1, 2, ..., d,$

где d является количеством размерностей, n является количеством наблюдений, и $σ_{i}$ стандартное отклонение i ^th варьируемая величина [4].

Пример: 'Bandwidth',0.8

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Kernel','triangle','Function,'cdf' задает тот mvksdensity оценивает cdf выборочных данных с помощью треугольной функции ядра.

`'BoundaryCorrection'` — Граничный метод коррекции
'журнал' (значение по умолчанию) | 'отражение'

Граничный метод коррекции в виде разделенной запятой пары, состоящей из 'BoundaryCorrection' и любой 'log' или 'reflection'.

Значение Описание

Значение	Описание
`'log'`	`mvksdensity` преобразует ограниченные данные, чтобы быть неограниченным при помощи одного из следующих преобразований. Затем это преобразовывает назад к исходной ограниченной шкале после оценки плотности. Если вы задаете `'Support','positive'`то `mvksdensity` применяет `log`(_xj) для каждой размерности, где _xj является `j`столбец th входного параметра `x`. Если вы задаете `'Support'` как матрица 2D строки, состоящая из нижних и верхних пределов для каждой размерности, затем `mvksdensity` применяет `log`((_xj-_Lj) / (_Uj-_xj)) для каждой размерности, где _Lj и _Uj являются нижними и верхними пределами `j`размерность th, соответственно. Значение `bw` находится по шкале преобразованных значений.
`'reflection'`	`mvksdensity` приращения ограничили данные путем добавления отраженных данных около контуров, затем это возвращает оценки, соответствующие исходной поддержке. Для получения дополнительной информации см. Отражательный Метод.

'log'

mvksdensity преобразует ограниченные данные, чтобы быть неограниченным при помощи одного из следующих преобразований. Затем это преобразовывает назад к исходной ограниченной шкале после оценки плотности.

Если вы задаете 'Support','positive'то mvksdensity применяет log(_xj) для каждой размерности, где _xj является jстолбец th входного параметра x.
Если вы задаете 'Support' как матрица 2D строки, состоящая из нижних и верхних пределов для каждой размерности, затем mvksdensity применяет log((_xj-_Lj) / (_Uj-_xj)) для каждой размерности, где _Lj и _Uj являются нижними и верхними пределами jразмерность th, соответственно.

Значение bw находится по шкале преобразованных значений.

'reflection'

mvksdensity приращения ограничили данные путем добавления отраженных данных около контуров, затем это возвращает оценки, соответствующие исходной поддержке. Для получения дополнительной информации см. Отражательный Метод.

mvksdensity применяет граничную коррекцию только, когда вы задаете 'Support' как значение кроме 'unbounded'.

Пример: 'BoundaryCorrection','reflection'

`'Function'` — Функция, чтобы оценить
`'pdf'` (значение по умолчанию) | `'cdf'` | `'survivor'`

Функция, чтобы оценить в виде разделенной запятой пары, состоящей из 'Function' и одно из следующих.

Значение	Описание
`'pdf'`	Функция плотности вероятности
`'cdf'`	Кумулятивная функция распределения
`'survivor'`	Функция оставшегося в живых

Пример: 'Function', 'cdf'

`'Kernel'` — Тип более сглаженного ядра
`'normal'` (значение по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | указатель на функцию | вектор символов | строковый скаляр

Тип ядра, более сглаженного в виде разделенной запятой пары, состоящей из 'Kernel' и одно из следующих.

Значение	Описание
`'normal'`	Нормальное (Гауссово) ядро
`'box'`	Ядро поля
`'triangle'`	Треугольное ядро
`'epanechnikov'`	Ядро Епанечникова

Можно также задать функцию ядра, которая является пользовательским или встроенной функцией. Задайте функцию как указатель на функцию (например, @myfunction или @normpdf) или как вектор символов или строковый скаляр (например, 'myfunction' или 'normpdf'). Программное обеспечение вызывает заданную функцию с одним аргументом, который является массивом расстояний между значениями данных и местоположениями, где плотность оценена, нормирована на пропускную способность в той размерности. Функция должна возвратить массив, одного размера содержащий соответствующие значения функции ядра.

mvksdensity применяет то же ядро к каждой размерности.

Пример: 'Kernel','box'

`'Support'` — Поддержка плотности
`'unbounded'` (значение по умолчанию) | `'positive'` | 2 d матрицей

Поддержка плотности в виде разделенной запятой пары, состоящей из 'support' и одно из следующих.

Значение	Описание
`'unbounded'`	Позвольте плотности расширять по целой действительной линии
`'positive'`	Ограничьте плотность положительными значениями
2 d матрицей	Задайте конечные нижние и верхние границы для поддержки плотности. Первая строка содержит нижние пределы, и вторая строка содержит верхние пределы. Каждый столбец содержит пределы для одной размерности `x`.

'Support' может также быть комбинация положительных, неограниченных, и ограниченных переменных, заданных как [0 -Inf L; Inf Inf U].

Пример: 'Support','positive'

Типы данных: single | double | char | string

`'Weights'` — Веса для выборочных данных
вектор

Веса для выборочных данных в виде разделенной запятой пары, состоящей из 'Weights' и вектор из длины size(x,1), где x выборочные данные.

Пример: 'Weights',xw

Типы данных: single | double

Выходные аргументы

свернуть все

`f` — Предполагаемые значения функции
вектор

Предполагаемые значения функции, возвращенные как вектор. f и pts имейте одинаковое число строк.

Больше о

свернуть все

Многомерное ядерное распределение

Многомерное ядерное распределение является непараметрическим представлением функции плотности вероятности (PDF) случайного вектора. Можно использовать ядерное распределение, когда параметрическое распределение не может правильно описать данные, или, когда это необходимо, постараться не делать предположения о распределении данных. Многомерное ядерное распределение задано функцией сглаживания и матрицей пропускной способности, которые управляют гладкостью получившейся кривой плотности.

Многомерным средством оценки плотности ядра является предполагаемая PDF случайного вектора. Позвольте x = (_x1, _x2, …, _xd)' быть d - размерный случайный вектор с функцией плотности f и позволить _yi = (_yi1, _yi2, …, _yid)' быть случайной выборкой, чертившей от f для i = 1, 2, …, n, где n является количеством случайных выборок. Для любых векторов действительных чисел x многомерным средством оценки плотности ядра дают

${\hat{f}}_{H} (x) = \frac{1}{n} \sum_{i = 1}^{n} K_{H} (x - y_{i}),$

где $K_{H} (x) = {| H |}^{- 1 / 2} K (H^{- 1 / 2} x)$ , $K (\cdot)$ функция сглаживания ядра, и H является d-by-d матрица пропускной способности.

mvksdensity использует диагональную матрицу пропускной способности и ядро продукта. Таким образом, ^H1/2 является квадратной диагональной матрицей с элементами вектора (_h1, _h2, …, _hd) на основной диагонали. K(x) принимает форму продукта K(x) = k (_x1) k (_x2) ⋯k (_xd), где $k (\cdot)$ одномерная функция сглаживания ядра. Затем многомерное средство оценки плотности ядра становится

${\hat{f}}_{H} (x) = \frac{1}{n} \sum_{i = 1}^{n} K_{H} (x - y_{i}) = \frac{1}{n h_{1} h_{2} \dots h_{d}} \sum_{i = 1}^{n} K (\frac{x_{1} - y_{i 1}}{h_{1}}, \frac{x_{2} - y_{i 2}}{h_{2}}, \dots, \frac{x_{d} - y_{i d}}{h_{d}}) = \frac{1}{n h_{1} h_{2} \dots h_{d}} \sum_{i = 1}^{n} \prod_{j = 1}^{d} k (\frac{x_{j} - y_{i j}}{h_{j}}) .$

Средством оценки ядра для кумулятивной функции распределения (cdf), для любых векторов действительных чисел x, дают

${\hat{F}}_{H} (x) = \int_{- \infty}^{x_{1}} \int_{- \infty}^{x_{2}} \dots \int_{- \infty}^{x_{d}} {\hat{f}}_{H} (t) d t_{d} \dots d t_{2} d t_{1} = \frac{1}{n} \sum_{i = 1}^{n} \prod_{j = 1}^{d} G (\frac{x_{j} - y_{i j}}{h_{j}}),$

где $G (x_{j}) = \int_{- \infty}^{x_{j}} k (t_{j}) d t_{j}$ .

Отражательный метод

Отражательный метод является граничным методом коррекции, который точно находит средства оценки плотности ядра, когда случайная переменная имеет ограниченный носитель. Если вы задаете 'BoundaryCorrection','reflection', mvksdensity использует отражательный метод.

Если вы дополнительно задаете 'Support' как матрица 2D строки, состоящая из нижних и верхних пределов для каждой размерности, затем mvksdensity находит средство оценки ядра можно следующим образом.

Если 'Function' 'pdf', затем средство оценки плотности ядра
${\hat{f}}_{H} (x) = \frac{1}{n h_{1} h_{2} \dots h_{d}} \sum_{i = 1}^{n} \prod_{j = 1}^{d} [k (\frac{x_{j} - y_{i j}^{-}}{h_{j}}) + k (\frac{x_{j} - y_{i j}}{h_{j}}) + k (\frac{x_{j} - y_{i j}^{+}}{h_{j}})]$ для _Lj ≤ _xj ≤ _Uj,
где $y_{i j}^{-} = 2 L_{j} - y_{i j}$ , $y_{i j}^{+} = 2 U_{j} - y_{i j}$ , и _yij является jэлемент th iвыборочные данные th, соответствующие x(i,j) из входного параметра x. _Lj и _Uj являются нижними и верхними пределами jразмерность th, соответственно.
Если 'Function' 'cdf', затем средство оценки ядра для cdf
${\hat{F}}_{H} (x) = \frac{1}{n} \sum_{i = 1}^{n} \prod_{j = 1}^{d} [G (\frac{x_{j} - y_{i j}^{-}}{h_{j}}) + G (\frac{x_{j} - y_{i j}}{h_{j}}) + G (\frac{x_{j} - y_{i j}^{+}}{h_{j}}) - G (\frac{L_{j} - y_{i j}^{-}}{h_{j}}) - G (\frac{L_{j} - y_{i j}}{h_{j}}) - G (\frac{L_{j} - y_{i j}^{+}}{h_{j}})]$ для _Lj ≤ _xj ≤ _Uj.
Получить средство оценки ядра для функции оставшегося в живых (когда 'Function' 'survivor'), mvksdensity использование оба ${\hat{f}}_{H} (x)$ и ${\hat{F}}_{H} (x)$ .

Если вы дополнительно задаете 'Support' как 'positive' или матрица включая [0 inf]то mvksdensity находит средство оценки плотности ядра, заменяя _{[Lj Uj]} с [0 inf] в вышеупомянутых уравнениях.

Ссылки

[1] Лучник, A. W. и А. Аццалини. Прикладные методы сглаживания для анализа данных. Нью-Йорк: Oxford University Press Inc., 1997.

[2] Выступ, P. D. “Оценка ядра функции распределения”. Коммуникации в Статистике – Теория и Методы. Издание 14, Выпуск 3, 1985, стр 605-620.

[3] Джонс, Член конгресса “Простая граничная коррекция для оценки плотности ядра”. Статистика и Вычисление. Издание 3, Выпуск 3, 1993, стр 135-146.

[4] Сильверман, B. W. Оценка плотности для статистики и анализ данных. Chapman & Hall/CRC, 1986.

[5] Скотт, D. W. Многомерная оценка плотности: теория, практика и визуализация. John Wiley & Sons, 2015.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

Имена в аргументах пары "имя-значение", включая 'Bandwidth', должны быть константы времени компиляции.
Значения в следующих аргументах пары "имя-значение" должны также быть константами времени компиляции: 'BoundaryCorrection'функция, и 'Kernel'. Например, чтобы использовать 'Function','cdf' аргумент пары "имя-значение" в сгенерированном коде, включайте {coder.Constant('Function'),coder.Constant('cdf')} в -args значение codegen.
Значение 'Kernel' аргументом пары "имя-значение" не может быть пользовательский указатель на функцию. Чтобы задать пользовательскую функцию ядра, используйте вектор символов или строковый скаляр.
Для значения 'Support' аргумент пары "имя-значение", тип данных времени компиляции должен совпадать с типом данных во время выполнения.

Для получения дополнительной информации о генерации кода смотрите Введение в Генерацию кода и Общий Рабочий процесс Генерации кода.

Смотрите также

ksdensity

Темы

Введенный в R2016a

Документация Statistics and Machine Learning Toolbox

Поддержка

Сообщество Экспонента

Документация

mvksdensity

Синтаксис

Описание

Примеры

Оцените многомерную плотность ядра

Оцените многомерную плотность ядра Используя сетки

Входные параметры

x — Выборочные данные числовая матрица

pts — Точки, в которых можно оценить f матрица

bw — Значение для пропускной способности окна сглаживания ядра скалярное значение | d - вектор элемента

Аргументы в виде пар имя-значение

'BoundaryCorrection' — Граничный метод коррекции 'журнал' (значение по умолчанию) | 'отражение'

'Function' — Функция, чтобы оценить 'pdf' (значение по умолчанию) | 'cdf' | 'survivor'

'Kernel' — Тип более сглаженного ядра 'normal' (значение по умолчанию) | 'box' | 'triangle' | 'epanechnikov' | указатель на функцию | вектор символов | строковый скаляр

'Support' — Поддержка плотности 'unbounded' (значение по умолчанию) | 'positive' | 2 d матрицей

'Weights' — Веса для выборочных данных вектор

Выходные аргументы

f — Предполагаемые значения функции вектор

Больше о

Многомерное ядерное распределение

Отражательный метод

Ссылки

Расширенные возможности

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Документация Statistics and Machine Learning Toolbox

Поддержка

`x` — Выборочные данные
числовая матрица

`pts` — Точки, в которых можно оценить f
матрица

`bw` — Значение для пропускной способности окна сглаживания ядра
скалярное значение | d - вектор элемента

`'BoundaryCorrection'` — Граничный метод коррекции
'журнал' (значение по умолчанию) | 'отражение'

`'Function'` — Функция, чтобы оценить
`'pdf'` (значение по умолчанию) | `'cdf'` | `'survivor'`

`'Kernel'` — Тип более сглаженного ядра
`'normal'` (значение по умолчанию) | `'box'` | `'triangle'` | `'epanechnikov'` | указатель на функцию | вектор символов | строковый скаляр

`'Support'` — Поддержка плотности
`'unbounded'` (значение по умолчанию) | `'positive'` | 2 d матрицей

`'Weights'` — Веса для выборочных данных
вектор

`f` — Предполагаемые значения функции
вектор

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.