Создание модели дискриминантного анализа

Модель для дискриминантного анализа:

  • Каждый класс (Y) генерирует данные (X) с помощью многомерного нормального распределения. Другими словами, модель принимает, что X имеет Гауссово распределение смеси (gmdistribution).

    • Для линейного дискриминантного анализа модель имеет ту же ковариационную матрицу для каждого класса; только средние значения отличаются.

    • Для квадратичного дискриминантного анализа отличаются и средние значения и ковариации каждого класса.

Под этим предположением моделирования fitcdiscr выводит среднее значение и параметры ковариации каждого класса.

  • Для линейного дискриминантного анализа это вычисляет демонстрационное среднее значение каждого класса. Затем это вычисляет выборочную ковариацию первым вычитанием демонстрационного среднего значения каждого класса от наблюдений за тем классом и взятия эмпирической ковариационной матрицы результата.

  • Для квадратичного дискриминантного анализа это вычисляет демонстрационное среднее значение каждого класса. Затем это вычисляет выборочные ковариации первым вычитанием демонстрационного среднего значения каждого класса от наблюдений за тем классом и взятия эмпирической ковариационной матрицы каждого класса.

Метод fit не использует априорные вероятности или затраты для подбора кривой.

Взвешенные наблюдения

fitcdiscr создает взвешенные классификаторы с помощью следующей схемы. Предположим, что M является N-by-K матрица членства в классе:

Mnk = 1, если наблюдение n является от класса k
Mnk = 0 в противном случае.

Оценка среднего значения класса для невзвешенных данных

μ^k=n=1NMnkxnn=1NMnk.

Для взвешенных данных с положительными весами wn естественное обобщение

μ^k=n=1NMnkwnxnn=1NMnkwn.

Объективная оценка объединенного - в ковариационной матрице для невзвешенных данных

Σ^=n=1Nk=1KMnk(xnμ^k)(xnμ^k)TNK.

Для квадратичного дискриминантного анализа fitcdiscr использует K = 1.

Для взвешенных данных, принимая сумму весов к 1, объективная оценка объединенного - в ковариационной матрице

Σ^=n=1Nk=1KMnkwn(xnμ^k)(xnμ^k)T1k=1KWk(2)Wk,

где

  • Wk=n=1NMnkwn сумма весов для класса k.

  • Wk(2)=n=1NMnkwn2 сумма весов в квадрате в классе.

Смотрите также

Функции

Объекты

Похожие темы