Маркировка новых данных с помощью полууправляемого классификатора на основе графов
Чтобы подогнать метки к немаркированным учебным данным, fitsemigraph строит график подобия с помеченными и немечеными наблюдениями в качестве узлов и распределяет информацию метки из помеченных наблюдений в немеченые наблюдения, используя распространение метки или расширение метки. Получающееся SemiSupervisedGraphModel объект сохраняет подогнанные метки и оценки меток для немеченых данных в своих FittedLabels и LabelScores соответственно.
Чтобы предсказать метку нового наблюдения x, predict функция использует взвешенное среднее соседних показателей наблюдения для вычисления показателей метки для x, а именно , xj).
n - количество наблюдений в данных обучения.
Fxj - вектор строки показателей метки для обучающего наблюдения xj (или узла j). Дополнительные сведения о вычислении показателей меток для учебных наблюдений см. в разделе Алгоритмы.
S (x, xj) - парное сходство между новым наблюдением x и тренировочным наблюдением xj, где S (xi, xj) = Si, j является таким, как определено на графике подобия.
Столбец с максимальным баллом в Fx соответствует прогнозируемой метке класса для x. Для получения дополнительной информации см. [1].
[1] Делальо, Оливье, Йошуа Бенгио и Николя Ле Ру. «Эффективная индукция непараметрических функций в полууправляемом обучении». Материалы десятого Международного практикума по искусственному интеллекту и статистике. 2005.