Наивный шаблон классификатора Байеса
возвращает наивный шаблон Байеса, подходящий для обучающих многоклассовых моделей кода вывода с исправлением ошибок (ECOC). t = templateNaiveBayes()
Если указан шаблон по умолчанию, то программа использует значения по умолчанию для всех входных аргументов во время обучения.
Определить t как ученик в fitcecoc.
возвращает шаблон с дополнительными параметрами, заданными одним или несколькими аргументами пары имя-значение. Все свойства t = templateNaiveBayes(Name,Value)t пусты, за исключением тех, которые указаны с помощью Name,Value аргументы пары.
Например, можно указать распределения для предикторов.
При отображении t в окне команд все параметры отображаются пустыми ([]), за исключением тех, которые указаны с помощью аргументов пары имя-значение. Во время обучения программа использует значения по умолчанию для пустых параметров.
При указании 'DistributionNames','mn' при обучении Mdl использование fitcnb, то программное обеспечение подходит для полиномиального распределения с использованием модели мешков токенов. Программа сохраняет вероятность того, что маркер j появляется в классе k в свойстве DistributionParameters{. При использовании аддитивного сглаживания [2] оценочная вероятность равнаk,j}
cj' kP + ck,
где:
который является взвешенным числом вхождений маркера j в классе k.
nk - количество наблюдений в классе k.
- вес для наблюдения. Программное обеспечение нормализует веса внутри класса таким образом, что они суммируются с предыдущей вероятностью для этого класса.
общее взвешенное число вхождений всех маркеров в классе k.
При указании 'DistributionNames','mvmn' при обучении Mdl использование fitcnb, затем:
Для каждого предиктора программное обеспечение собирает список уникальных уровней, сохраняет отсортированный список в CategoricalLevelsи рассматривает каждый уровень как ячейку. Каждая комбинация предиктор/класс является отдельной независимой полиномиальной случайной величиной.
Для предиктора j в классе k программное обеспечение подсчитывает экземпляры каждого категориального уровня с использованием списка, сохраненного в CategoricalLevels{.j}
Программное обеспечение сохраняет вероятность того, что предиктор j, в классе k, имеет уровень L в свойстве DistributionParameters{, для всех уровней в k,j}CategoricalLevels{. При использовании аддитивного сглаживания [2] оценочная вероятность равнаj}
L) mj + mk,
где:
kwi, который является взвешенным числом наблюдений, для которых предиктор j равен L в классе k.
nk - количество наблюдений в классе k.
} = 1, если xij = L, в противном случае 0.
- вес для наблюдения. Программное обеспечение нормализует веса внутри класса таким образом, что они суммируются с предыдущей вероятностью для этого класса.
mj - количество различных уровней в предикторе j.
mk - взвешенное число наблюдений в классе k.
[1] Хасти, Т., Р. Тибширани и Дж. Фридман. Элементы статистического обучения, второе издание. Нью-Йорк: Спрингер, 2008.
[2] Мэннинг, К. Д., П. Рагхаван и М. Шютце. Введение в поиск информации, Нью-Йорк: Cambridge University Press, 2008.
ClassificationECOC | ClassificationNaiveBayes | fitcecoc | fitcnb