exponenta event banner

Класс дискриминанта

Суперклассы: CompactClassificationDiscriminant

Классификация дискриминантного анализа

Описание

A ClassificationDiscriminant объект инкапсулирует классификатор дискриминантного анализа, который является гауссовой моделью смешения для генерации данных. A ClassificationDiscriminant объект может прогнозировать ответы для новых данных с помощью predict способ. Объект содержит данные, используемые для обучения, что позволяет вычислить прогнозы повторного замещения.

Строительство

Создать ClassificationDiscriminant объект с помощью fitcdiscr.

Свойства

BetweenSigma

pоколо-p матрица, ковариация между классами, где p - количество предикторов.

CategoricalPredictors

Индексы категориального предиктора, который всегда пуст ([]) .

ClassNames

Перечень элементов в данных обучения Y с удаленными дубликатами. ClassNames может быть категориальным массивом, массивом ячеек символьных векторов, символьным массивом, логическим вектором или числовым вектором. ClassNames имеет тот же тип данных, что и данные в аргументе Y. (Программа рассматривает строковые массивы как массивы ячеек символьных векторов.)

Coeffs

kоколо-k структура матриц коэффициентов, где k - количество классов. Coeffs(i,j) содержит коэффициенты линейных или квадратичных границ между классами i и j. Поля в Coeffs(i,j):

  • DiscrimType

  • Class1ClassNames(i)

  • Class2ClassNames(j)

  • Const - скаляр

  • Linear - Вектор с p компоненты, где p - количество столбцов в X

  • Quadraticpоколо-p матрица, существует для квадратичной DiscrimType

Уравнение границы между классами i и класс j является

Const + Linear * x + x' * Quadratic * x = 0,

где x - вектор столбца длины p.

Если fitcdiscr имел FillCoeffs пара имя-значение установлена в 'off' при построении классификатора, Coeffs пуст ([]).

Cost

Квадратная матрица, где Cost(i,j) - стоимость классификации точки по классу j если его истинный класс i (т.е. строки соответствуют истинному классу, а столбцы соответствуют прогнозируемому классу). Порядок строк и столбцов Cost соответствует порядку классов в ClassNames. Количество строк и столбцов в Cost - количество уникальных классов в ответе.

Изменение Cost матрица с использованием точечной нотации: obj.Cost = costMatrix.

Delta

Значение порога дельты для линейной дискриминантной модели, неотрицательного скаляра. Если коэффициент obj имеет магнитуду меньше, чем Delta, obj устанавливает этот коэффициент равным 0и, таким образом, вы можете исключить соответствующий предиктор из модели. Набор Delta к более высокому значению, чтобы исключить больше предикторов.

Delta должно быть 0 для квадратичных дискриминантных моделей.

Изменение Delta с использованием точечной нотации: obj.Delta = newDelta.

DeltaPredictor

Вектор строки длиной, равной числу предикторов в obj. Если DeltaPredictor(i) < Delta затем коэффициент i модели 0.

Если obj является квадратичной дискриминантной моделью, все элементы DeltaPredictor являются 0.

DiscrimType

Символьный вектор, определяющий тип дискриминанта. Один из:

  • 'linear'

  • 'quadratic'

  • 'diagLinear'

  • 'diagQuadratic'

  • 'pseudoLinear'

  • 'pseudoQuadratic'

Изменение DiscrimType с использованием точечной нотации: obj.DiscrimType = newDiscrimType.

Можно изменять между линейными типами или между квадратичными типами, но нельзя изменять между линейными и квадратичными типами.

Gamma

Значение параметра регуляризации Гамма, скаляр из 0 кому 1. Изменение Gamma с использованием точечной нотации: obj.Gamma = newGamma.

  • Если установить 1 для линейного дискриминанта дискриминант устанавливает свой тип равным 'diagLinear'.

  • Если задано значение между MinGamma и 1 для линейного дискриминанта дискриминант устанавливает свой тип равным 'linear'.

  • Нельзя установить значения ниже значения MinGamma собственность.

  • Для квадратичного дискриминанта можно задать либо 0 (для DiscrimType 'quadratic') или 1 (для DiscrimType 'diagQuadratic').

HyperparameterOptimizationResults

Описание оптимизации гиперпараметров с перекрестной проверкой, сохраненное как BayesianOptimization объект или таблица гиперпараметров и связанных значений. Непусто, когда OptimizeHyperparameters пара имя-значение не является пустой при создании. Значение зависит от настройки HyperparameterOptimizationOptions пара имя-значение при создании:

  • 'bayesopt' (по умолчанию) - объект класса BayesianOptimization

  • 'gridsearch' или 'randomsearch' - Таблица используемых гиперпараметров, наблюдаемых значений целевой функции (потери перекрестной проверки) и ранга наблюдений от самого низкого (лучший) до самого высокого (худший)

LogDetSigma

Логарифм определителя ковариационной матрицы внутри класса. Тип LogDetSigma зависит от типа дискриминанта:

  • Скаляр для линейного дискриминантного анализа

  • Вектор длины K для квадратичного дискриминантного анализа, где K - количество классов

MinGamma

Неотрицательный скаляр, минимальное значение параметра Гамма, так что корреляционная матрица является обратимой. Если корреляционная матрица не является единственной, MinGamma является 0.

ModelParameters

Параметры, используемые при обучении obj.

Mu

Класс означает, указанный как Kоколо-p матрица класса скалярных значений - средство размера. K - количество классов, и p - количество предикторов. Каждая строка Mu представляет среднее значение многомерного нормального распределения соответствующего класса. Индексы классов находятся в ClassNames атрибут.

NumObservations

Количество наблюдений в учебных данных, числовой скаляр. NumObservations может быть меньше числа строк входных данных X при отсутствии значений в X или ответ Y.

PredictorNames

Массив ячеек имен для переменных предиктора в порядке их появления в данных обучения X.

Prior

Числовой вектор предшествующих вероятностей для каждого класса. Порядок элементов Prior соответствует порядку классов в ClassNames.

Добавить или изменить Prior вектор с использованием точечной нотации: obj.Prior = priorVector.

ResponseName

Символьный вектор, описывающий переменную ответа Y.

ScoreTransform

Символьный вектор, представляющий встроенную функцию преобразования или дескриптор функции для преобразования баллов. 'none' означает отсутствие трансформации; эквивалентно, 'none' средства @(x)x. Список встроенных функций преобразования и синтаксис пользовательских функций преобразования см. в разделе fitcdiscr.

Реализация точечной нотации для добавления или изменения ScoreTransform с помощью одной из следующих функций:

  • cobj.ScoreTransform = 'function'

  • cobj.ScoreTransform = @function

Sigma

Ковариационная матрица или матрицы внутри класса. Размеры зависят от DiscrimType:

  • 'linear' (по умолчанию) - Матрица размера pоколо-p, где p - количество предикторов

  • 'quadratic' - Массив размеров pоколо-pоколо-K, где K - количество классов

  • 'diagLinear' - Вектор строки длины p

  • 'diagQuadratic' - Массив размеров 1около-pоколо-K

  • 'pseudoLinear' - Матрица размера pоколо-p

  • 'pseudoQuadratic' - Массив размеров pоколо-pоколо-K

W

Чешуйчатый weights, вектор с длиной n, количество строк в X.

X

Матрица предикторных значений. Каждый столбец X представляет один предиктор (переменную), и каждая строка представляет одно наблюдение.

Xcentered

X данные со средством класса вычитаются. Если Y(i) имеет класс j,

Xcentered(i,:) = X(i,:)Mu(j,:),

где Mu - среднее свойство класса.

Y

Категориальный массив, массив ячеек символьных векторов, символьный массив, логический вектор или числовой вектор с тем же количеством строк, что и X. Каждая строка Y представляет классификацию соответствующей строки X.

Функции объекта

compactКомпактный классификатор дискриминантного анализа
compareHoldoutСравнение точности двух классификационных моделей с использованием новых данных
crossvalКлассификатор перекрестного дискриминантного анализа
cvshrinkПерекрестная проверка регуляризации линейного дискриминанта
edgeКрай классификации
limeЛокальные интерпретируемые модели-агностические объяснения (LIME)
logpЛогарифмическая безусловная плотность вероятности для классификатора дискриминантного анализа
lossОшибка классификации
mahalРасстояние Махаланобиса до классовых средств
marginПоля классификации
nLinearCoeffsКоличество ненулевых линейных коэффициентов
partialDependenceВычислить частичную зависимость
plotPartialDependenceСоздание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE)
predictПрогнозирование меток с использованием модели классификации анализа дискриминантов
resubEdgeКрай классификации путем повторной субституции
resubLossОшибка классификации в результате повторного предоставления
resubMarginКлассификационные маржи по возврату
resubPredictПрогнозировать метки повторного замещения модели классификации анализа дискриминантов
shapleyЗначения Шапли
testckfoldСравнение точности двух классификационных моделей с помощью повторной перекрестной проверки

Копирование семантики

Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.

Примеры

свернуть все

Загрузите набор данных радужки Фишера.

load fisheriris

Обучение дискриминантной модели анализа с использованием всего набора данных.

Mdl = fitcdiscr(meas,species)
Mdl = 
  ClassificationDiscriminant
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'setosa'  'versicolor'  'virginica'}
           ScoreTransform: 'none'
          NumObservations: 150
              DiscrimType: 'linear'
                       Mu: [3x4 double]
                   Coeffs: [3x3 struct]


  Properties, Methods

Mdl является ClassificationDiscriminant модель. Для доступа к его свойствам используйте точечную нотацию. Например, отобразить групповое средство для каждого предсказателя.

Mdl.Mu
ans = 3×4

    5.0060    3.4280    1.4620    0.2460
    5.9360    2.7700    4.2600    1.3260
    6.5880    2.9740    5.5520    2.0260

Чтобы предсказать метки для новых наблюдений, передайте Mdl и данные предиктора для predict.

Подробнее

развернуть все

Ссылки

[1] Го, Я., Т. Хасти и Р. Тибширани. «Регуляризованный линейный дискриминантный анализ и его применение в микрочипах». Биостатистика, том 8, № 1, стр. 86-100, 2007.

Расширенные возможности

.
Представлен в R2011b