Класс дискриминанта

Суперклассы: CompactClassificationDiscriminant

Классификация дискриминантного анализа

Описание

A ClassificationDiscriminant объект инкапсулирует классификатор дискриминантного анализа, который является гауссовой моделью смешения для генерации данных. A ClassificationDiscriminant объект может прогнозировать ответы для новых данных с помощью predict способ. Объект содержит данные, используемые для обучения, что позволяет вычислить прогнозы повторного замещения.

Строительство

Создать ClassificationDiscriminant объект с помощью fitcdiscr.

Свойства

`BetweenSigma`	`p`около-`p` матрица, ковариация между классами, где `p` - количество предикторов.
`CategoricalPredictors`	Индексы категориального предиктора, который всегда пуст (`[]`) .
`ClassNames`	Перечень элементов в данных обучения `Y` с удаленными дубликатами. `ClassNames` может быть категориальным массивом, массивом ячеек символьных векторов, символьным массивом, логическим вектором или числовым вектором. `ClassNames` имеет тот же тип данных, что и данные в аргументе `Y`. (Программа рассматривает строковые массивы как массивы ячеек символьных векторов.)
`Coeffs`	`k`около-`k` структура матриц коэффициентов, где `k` - количество классов. `Coeffs(i,j)` содержит коэффициенты линейных или квадратичных границ между классами `i` и `j`. Поля в `Coeffs(i,j)`: `DiscrimType` `Class1` — `ClassNames(i)` `Class2` — `ClassNames(j)` `Const` - скаляр `Linear` - Вектор с `p` компоненты, где `p` - количество столбцов в `X` `Quadratic` — `p`около-`p` матрица, существует для квадратичной `DiscrimType` Уравнение границы между классами `i` и класс `j` является `Const` + `Linear` * `x` + `x'` * `Quadratic` * `x` = `0`, где `x` - вектор столбца длины `p`. Если `fitcdiscr` имел `FillCoeffs` пара имя-значение установлена в `'off'` при построении классификатора, `Coeffs` пуст (`[]`).
`Cost`	Квадратная матрица, где `Cost(i,j)` - стоимость классификации точки по классу `j` если его истинный класс `i` (т.е. строки соответствуют истинному классу, а столбцы соответствуют прогнозируемому классу). Порядок строк и столбцов `Cost` соответствует порядку классов в `ClassNames`. Количество строк и столбцов в `Cost` - количество уникальных классов в ответе. Изменение `Cost` матрица с использованием точечной нотации: `obj.Cost = costMatrix`.
`Delta`	Значение порога дельты для линейной дискриминантной модели, неотрицательного скаляра. Если коэффициент `obj` имеет магнитуду меньше, чем `Delta`, `obj` устанавливает этот коэффициент равным `0`и, таким образом, вы можете исключить соответствующий предиктор из модели. Набор `Delta` к более высокому значению, чтобы исключить больше предикторов. `Delta` должно быть `0` для квадратичных дискриминантных моделей. Изменение `Delta` с использованием точечной нотации: `obj.Delta = newDelta`.
`DeltaPredictor`	Вектор строки длиной, равной числу предикторов в `obj`. Если `DeltaPredictor(i) < Delta` затем коэффициент `i` модели `0`. Если `obj` является квадратичной дискриминантной моделью, все элементы `DeltaPredictor` являются `0`.
`DiscrimType`	Символьный вектор, определяющий тип дискриминанта. Один из: `'linear'` `'quadratic'` `'diagLinear'` `'diagQuadratic'` `'pseudoLinear'` `'pseudoQuadratic'` Изменение `DiscrimType` с использованием точечной нотации: `obj.DiscrimType = newDiscrimType`. Можно изменять между линейными типами или между квадратичными типами, но нельзя изменять между линейными и квадратичными типами.
`Gamma`	Значение параметра регуляризации Гамма, скаляр из `0` кому `1`. Изменение `Gamma` с использованием точечной нотации: `obj.Gamma = newGamma`. Если установить `1` для линейного дискриминанта дискриминант устанавливает свой тип равным `'diagLinear'`. Если задано значение между `MinGamma` и `1` для линейного дискриминанта дискриминант устанавливает свой тип равным `'linear'`. Нельзя установить значения ниже значения `MinGamma` собственность. Для квадратичного дискриминанта можно задать либо `0` (для `DiscrimType` `'quadratic'`) или `1` (для `DiscrimType` `'diagQuadratic'`).
`HyperparameterOptimizationResults`	Описание оптимизации гиперпараметров с перекрестной проверкой, сохраненное как `BayesianOptimization` объект или таблица гиперпараметров и связанных значений. Непусто, когда `OptimizeHyperparameters` пара имя-значение не является пустой при создании. Значение зависит от настройки `HyperparameterOptimizationOptions` пара имя-значение при создании: `'bayesopt'` (по умолчанию) - объект класса `BayesianOptimization` `'gridsearch'` или `'randomsearch'` - Таблица используемых гиперпараметров, наблюдаемых значений целевой функции (потери перекрестной проверки) и ранга наблюдений от самого низкого (лучший) до самого высокого (худший)
`LogDetSigma`	Логарифм определителя ковариационной матрицы внутри класса. Тип `LogDetSigma` зависит от типа дискриминанта: Скаляр для линейного дискриминантного анализа Вектор длины `K` для квадратичного дискриминантного анализа, где `K` - количество классов
`MinGamma`	Неотрицательный скаляр, минимальное значение параметра Гамма, так что корреляционная матрица является обратимой. Если корреляционная матрица не является единственной, `MinGamma` является `0`.
`ModelParameters`	Параметры, используемые при обучении `obj`.
`Mu`	Класс означает, указанный как `K`около-`p` матрица класса скалярных значений - средство размера. `K` - количество классов, и `p` - количество предикторов. Каждая строка `Mu` представляет среднее значение многомерного нормального распределения соответствующего класса. Индексы классов находятся в `ClassNames` атрибут.
`NumObservations`	Количество наблюдений в учебных данных, числовой скаляр. `NumObservations` может быть меньше числа строк входных данных `X` при отсутствии значений в `X` или ответ `Y`.
`PredictorNames`	Массив ячеек имен для переменных предиктора в порядке их появления в данных обучения `X`.
`Prior`	Числовой вектор предшествующих вероятностей для каждого класса. Порядок элементов `Prior` соответствует порядку классов в `ClassNames`. Добавить или изменить `Prior` вектор с использованием точечной нотации: `obj.Prior = priorVector`.
`ResponseName`	Символьный вектор, описывающий переменную ответа `Y`.
`ScoreTransform`	Символьный вектор, представляющий встроенную функцию преобразования или дескриптор функции для преобразования баллов. `'none'` означает отсутствие трансформации; эквивалентно, `'none'` средства `@(x)x`. Список встроенных функций преобразования и синтаксис пользовательских функций преобразования см. в разделе `fitcdiscr`. Реализация точечной нотации для добавления или изменения `ScoreTransform` с помощью одной из следующих функций: `cobj.ScoreTransform = 'function'` `cobj.ScoreTransform = @function`
`Sigma`	Ковариационная матрица или матрицы внутри класса. Размеры зависят от `DiscrimType`: `'linear'` (по умолчанию) - Матрица размера `p`около-`p`, где `p` - количество предикторов `'quadratic'` - Массив размеров `p`около-`p`около-`K`, где `K` - количество классов `'diagLinear'` - Вектор строки длины `p` `'diagQuadratic'` - Массив размеров `1`около-`p`около-`K` `'pseudoLinear'` - Матрица размера `p`около-`p` `'pseudoQuadratic'` - Массив размеров `p`около-`p`около-`K`
`W`	Чешуйчатый `weights`, вектор с длиной `n`, количество строк в `X`.
`X`	Матрица предикторных значений. Каждый столбец `X` представляет один предиктор (переменную), и каждая строка представляет одно наблюдение.
`Xcentered`	`X` данные со средством класса вычитаются. Если `Y(i)` имеет класс `j`, `Xcentered(i,:)` = `X(i,:)` – `Mu(j,:)`, где `Mu` - среднее свойство класса.
`Y`	Категориальный массив, массив ячеек символьных векторов, символьный массив, логический вектор или числовой вектор с тем же количеством строк, что и `X`. Каждая строка `Y` представляет классификацию соответствующей строки `X`.

Функции объекта

`compact`	Компактный классификатор дискриминантного анализа
`compareHoldout`	Сравнение точности двух классификационных моделей с использованием новых данных
`crossval`	Классификатор перекрестного дискриминантного анализа
`cvshrink`	Перекрестная проверка регуляризации линейного дискриминанта
`edge`	Край классификации
`lime`	Локальные интерпретируемые модели-агностические объяснения (LIME)
`logp`	Логарифмическая безусловная плотность вероятности для классификатора дискриминантного анализа
`loss`	Ошибка классификации
`mahal`	Расстояние Махаланобиса до классовых средств
`margin`	Поля классификации
`nLinearCoeffs`	Количество ненулевых линейных коэффициентов
`partialDependence`	Вычислить частичную зависимость
`plotPartialDependence`	Создание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE)
`predict`	Прогнозирование меток с использованием модели классификации анализа дискриминантов
`resubEdge`	Край классификации путем повторной субституции
`resubLoss`	Ошибка классификации в результате повторного предоставления
`resubMargin`	Классификационные маржи по возврату
`resubPredict`	Прогнозировать метки повторного замещения модели классификации анализа дискриминантов
`shapley`	Значения Шапли
`testckfold`	Сравнение точности двух классификационных моделей с помощью повторной перекрестной проверки

Копирование семантики

Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.

Примеры

свернуть все

Модель дискриминантного анализа поезда

Открыть сценарий в реальном времени

Загрузите набор данных радужки Фишера.

load fisheriris

Обучение дискриминантной модели анализа с использованием всего набора данных.

Mdl = fitcdiscr(meas,species)

Mdl = 
  ClassificationDiscriminant
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'setosa'  'versicolor'  'virginica'}
           ScoreTransform: 'none'
          NumObservations: 150
              DiscrimType: 'linear'
                       Mu: [3x4 double]
                   Coeffs: [3x3 struct]


  Properties, Methods

Mdl является ClassificationDiscriminant модель. Для доступа к его свойствам используйте точечную нотацию. Например, отобразить групповое средство для каждого предсказателя.

Mdl.Mu

ans = 3×4

    5.0060    3.4280    1.4620    0.2460
    5.9360    2.7700    4.2600    1.3260
    6.5880    2.9740    5.5520    2.0260

Чтобы предсказать метки для новых наблюдений, передайте Mdl и данные предиктора для predict.

Подробнее

развернуть все

Классификация дискриминантов

Модель дискриминантного анализа:

Каждый класс (Y) генерирует данные (X) с использованием многомерного нормального распределения. То есть модель предполагает X имеет распределение гауссовой смеси (gmdistribution).
- Для линейного дискриминантного анализа модель имеет одинаковую ковариационную матрицу для каждого класса, изменяются только средства.
- Для квадратичного дискриминантного анализа изменяются как средние, так и ковариации каждого класса.

predict классифицирует таким образом, чтобы минимизировать ожидаемые затраты на классификацию:

$\overset{}{y}^\underset{argminy = 1,}{=} ._{. .,}^{} \overset{}{} K∑k=1KP^(k 'x)$ C (y' k),

где

$\overset{}{y}$ ^ - прогнозируемая классификация.
K - количество классов.
$\overset{}{P}^($ k 'x) - задняя вероятность класса k для наблюдения x.
$C (y 'k$ ) - стоимость классификации наблюдения как y, когда его истинным классом является k.

Дополнительные сведения см. в разделе Прогнозирование с использованием моделей дискриминантного анализа.

Регуляризация

Регуляризация - это процесс поиска небольшого набора предикторов, которые дают эффективную прогностическую модель. Для линейного дискриминантного анализа существует два параметра, γ и δ, которые управляют регуляризацией следующим образом. cvshrink помогает выбрать соответствующие значения параметров.

Пусть Λ представляет ковариационную матрицу данных X, и пусть $\overset{}{X}$ ^ - центрированные данные (данные X минус среднее по классу). Определить

$D = {\overset{}{диаг}}^{(} X \hat{} T$ * X ^).

Регуляризованная ковариационная матрица $\overset{Σ˜}{}$

$\overset{}{} Σ˜=(1-γ)Σ+γD.$

Когда γ ≥ MinGamma, $\overset{Σ˜}{}$ негерметична.

Пусть _мкк - средний вектор для этих элементов X в классе k, и пусть мк0 - глобальный средний вектор (среднее из строк X). Пусть C - корреляционная матрица данных X, и пусть $\overset{C˜}{}$ - регуляризованная корреляционная матрица:

$\overset{}{} C˜= (1 - γ) C$ + γ I,

где I - единичная матрица.

Линейный член в классификаторе регуляризованного дискриминантного анализа для точки данных x равен

${(х -_{}}^{мк0} {\overset{}{)}}^{}_{TΣ˜−1} (_{} мкк - {мк0)_{} =}^{} [^{(х −} {\overset{)}{мк0}}^{} {TD}^{−} {1/2}_{]} [_{}$ C˜−1D−1/2 (мкк − мк0)].

Параметр δ входит в это уравнение как порог последнего члена в квадратных скобках. Каждая составляющая вектора $[{\overset{}{}}^{}^{C˜−1D−1/2} (_{} мкк_{−}$ мк0)] устанавливается равной нулю, если она меньше по величине, чем порог δ. Поэтому для класса k, если компонент j установлен в нуль, компонент j x не входит в оценку задней вероятности.

DeltaPredictor свойство является вектором, связанным с этим порогом. Когда δ ≥ DeltaPredictor(i), все классы k имеют

${\overset{}{}}^{}^{|C˜−1D−1/2} (_{} мкк_{−} мк0)$ |≤δ.

Следовательно, когда δ ≥ DeltaPredictor(i), регуляризованный классификатор не использует предиктор i.

Ссылки

[1] Го, Я., Т. Хасти и Р. Тибширани. «Регуляризованный линейный дискриминантный анализ и его применение в микрочипах». Биостатистика, том 8, № 1, стр. 86-100, 2007.

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Примечания и ограничения по использованию:

predict функция поддерживает генерацию кода.
При обучении модели дискриминантного анализа с помощью fitcdiscr или создать компактную модель дискриминантного анализа с помощью makecdiscr, значение 'ScoreTransform' аргумент пары имя-значение не может быть анонимной функцией.

Дополнительные сведения см. в разделе Введение в создание кода.

См. также

CompactClassificationDiscriminant | compareHoldout | fitcdiscr

Темы

Классификация дискриминантного анализа

Представлен в R2011b

Документация

Класс дискриминанта

Описание

Строительство

Свойства

Функции объекта

Копирование семантики

Примеры

Модель дискриминантного анализа поезда

Подробнее

Классификация дискриминантов

Регуляризация

Ссылки

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

Документация

Класс дискриминанта

Описание

Строительство

Свойства

Функции объекта

Копирование семантики

Примеры

Модель дискриминантного анализа поезда

Подробнее

Классификация дискриминантов

Регуляризация

Ссылки

Расширенные возможности

Создание кода C/C + + Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™