Модель дискриминантного анализа:
Каждый класс (Y) генерирует данные (X) с использованием многомерного нормального распределения. Другими словами, модель предполагает X имеет распределение гауссовой смеси (gmdistribution).
Для линейного дискриминантного анализа модель имеет одинаковую ковариационную матрицу для каждого класса; различаются только средства.
Для квадратичного дискриминантного анализа изменяются как средние, так и ковариации каждого класса.
При этом предположении моделирования, fitcdiscr выводит средние и ковариационные параметры каждого класса.
Для линейного дискриминантного анализа вычисляется среднее значение выборки каждого класса. Затем он вычисляет ковариацию выборки, сначала вычитая среднее значение выборки каждого класса из наблюдений этого класса и беря эмпирическую ковариационную матрицу результата.
Для квадратичного дискриминантного анализа вычисляется среднее значение выборки каждого класса. Затем он вычисляет ковариации выборки, сначала вычитая среднее значение выборки каждого класса из наблюдений этого класса и беря эмпирическую ковариационную матрицу каждого класса.
fit способ не использует предыдущие вероятности или затраты на подгонку.
fitcdiscr строит взвешенные классификаторы, используя следующую схему. Предположим, что M является матрицей членства класса N-на-K:
Mnk = 1, если наблюдение n из класса k
В противном случае Mnk = 0.
Оценка среднего значения класса для невзвешенных данных
Для взвешенных данных с положительными весами wn естественным обобщением является
Несмещенная оценка объединенной ковариационной матрицы для невзвешенных данных составляет
^ k) TN − K.
Для квадратичного дискриминантного анализа fitcdiscr использует K = 1.
Для взвешенных данных, предполагающих, что сумма весов равна 1, несмещенная оценка объединенной ковариационной матрицы равна
T1−∑k=1KWk (2) Wk,
где
- сумма весов для класса k.
=∑n=1NMnkwn2 - сумма квадратичных весов для класса.