kfoldPredict

Классифицируйте наблюдения на перекрестную подтвержденную модель классификации

    Описание

    пример

    label = kfoldPredict(CVMdl) возвращает метки класса, предсказанные перекрестным подтвержденным классификатором CVMdl. Для каждого сгиба, kfoldPredict предсказывает метки класса для наблюдений сгиба валидации с помощью классификатора, обученного на наблюдениях учебного сгиба. CVMdl.X и CVMdl.Y содержите оба набора наблюдений.

    label = kfoldPredict(CVMdl,'IncludeInteractions',includeInteractions) задает, включать ли периоды взаимодействия в расчеты. Этот синтаксис применяется только к обобщенным аддитивным моделям.

    пример

    [label,Score] = kfoldPredict(___) дополнительно возвращает предсказанные классификационные оценки для наблюдений сгиба валидации с помощью классификатора, обученного на наблюдениях учебного сгиба, с любым входным параметром в предыдущих синтаксисах.

    [label,Score,Cost] = kfoldPredict(CVMdl) дополнительно возвращает ожидаемые затраты misclassification для дискриминантного анализа, k - самый близкий сосед, наивный Бейес, и древовидные классификаторы.

    Примеры

    свернуть все

    Создайте матрицу беспорядка использование 10-кратных предсказаний перекрестной проверки модели дискриминантного анализа.

    Загрузите fisheriris набор данных. X содержит цветочные измерения для 150 различных цветов и y перечисляет разновидности или класс, для каждого цветка. Создайте переменную order это задает порядок классов.

    load fisheriris
    X = meas;
    y = species;
    order = unique(y)
    order = 3x1 cell
        {'setosa'    }
        {'versicolor'}
        {'virginica' }
    
    

    Создайте 10-кратную перекрестную подтвержденную модель дискриминантного анализа при помощи fitcdiscr функция. По умолчанию, fitcdiscr гарантирует, что наборы обучающих данных и наборы тестов имеют примерно те же пропорции цветочных разновидностей. Задайте порядок цветочных классов.

    cvmdl = fitcdiscr(X,y,'KFold',10,'ClassNames',order);

    Предскажите разновидности цветов набора тестов.

    predictedSpecies = kfoldPredict(cvmdl);

    Создайте матрицу беспорядка, которая сравнивает истинные значения класса с предсказанными значениями класса.

    confusionchart(y,predictedSpecies)

    Figure contains an object of type ConfusionMatrixChart.

    Найдите предсказания перекрестной проверки для основанного на модели на ирисовых данных Фишера.

    Загрузите ирисовый набор данных Фишера.

    load fisheriris

    Обучите ансамбль деревьев классификации с помощью AdaBoostM2. Задайте пни как слабых учеников.

    rng(1); % For reproducibility
    t = templateTree('MaxNumSplits',1);
    Mdl = fitcensemble(meas,species,'Method','AdaBoostM2','Learners',t);

    Перекрестный подтвердите обученный ансамбль, использующий 10-кратную перекрестную проверку.

    CVMdl = crossval(Mdl);

    Оцените предсказанные метки перекрестной проверки и баллы.

    [elabel,escore] = kfoldPredict(CVMdl);

    Отобразите максимальное и минимальное множество каждого класса.

    max(escore)
    ans = 1×3
    
        9.3862    8.9871   10.1866
    
    
    min(escore)
    ans = 1×3
    
        0.0018    3.8359    0.9573
    
    

    Входные параметры

    свернуть все

    Перекрестный подтвержденный разделенный классификатор в виде ClassificationPartitionedModel, ClassificationPartitionedEnsemble, или ClassificationPartitionedGAM объект. Можно создать объект двумя способами:

    • Передайте обученную модель классификации, перечисленную в следующей таблице к crossval объектная функция.

    • Обучите модель классификации использование функции, перечисленной в следующей таблице, и задайте одни из аргументов name-value перекрестной проверки для функции.

    Отметьте, чтобы включать периоды взаимодействия модели в виде true или false. Этот аргумент допустим только для обобщенной аддитивной модели (GAM). Таким образом, можно задать этот аргумент только когда CVMdl ClassificationPartitionedGAM.

    Значением по умолчанию является true если модели в CVMdl (CVMdl.Trained) содержите периоды взаимодействия. Значением должен быть false если модели не содержат периоды взаимодействия.

    Типы данных: логический

    Выходные аргументы

    свернуть все

    Предсказанные метки класса, возвращенные как категориальный вектор, логический вектор, числовой вектор, символьный массив или массив ячеек из символьных векторов. label имеет совпадающий тип данных и количество строк как CVMdl.Y. Каждая запись label соответствует предсказанной метке класса для соответствующего наблюдения в CVMdl.X.

    Если вы используете метод валидации затяжки, чтобы создать CVMdl (то есть, если CVMdl.KFold 1), затем проигнорируйте label значения для наблюдений учебного сгиба. Эти значения совпадают с классом самой высокой частоте.

    Классификационные оценки, возвращенные как n-by-K матрица, где n является количеством наблюдений (size(CVMdl.X,1) когда наблюдения находятся в строках), и K является количеством уникальных классов (size(CVMdl.ClassNames,1)). Классификационная оценка Score(i,j) представляет доверие что iнаблюдение th принадлежит, чтобы классифицировать j.

    Если вы используете метод валидации затяжки, чтобы создать CVMdl (то есть, если CVMdl.KFold 1), затем Score имеет NaN значения для наблюдений учебного сгиба.

    Ожидаемые затраты misclassification, возвращенные как n-by-K матрица, где n является количеством наблюдений (size(CVMdl.X,1) когда наблюдения находятся в строках), и K является количеством уникальных классов (size(CVMdl.ClassNames,1)). Значение Cost(i,j) среднее значение misclassification стоимость предсказания что iнаблюдение th принадлежит, чтобы классифицировать j.

    Примечание

    Если вы хотите возвратить этот выходной аргумент, CVMdl должен быть дискриминантный анализ, k - самый близкий сосед, наивный Бейес, или древовидный классификатор.

    Если вы используете метод валидации затяжки, чтобы создать CVMdl (то есть, если CVMdl.KFold 1), затем Cost имеет NaN значения для наблюдений учебного сгиба.

    Алгоритмы

    kfoldPredict вычисляет предсказания как описано в соответствии predict объектная функция. Для описания модели специфичного смотрите соответствующее predict страница ссылки на функцию в следующей таблице.

    Тип моделиpredict Функция
    Классификатор дискриминантного анализаpredict
    Классификатор ансамбляpredict
    Обобщенный аддитивный классификатор моделиpredict
    k- соседний классификаторpredict
    Наивный классификатор Байесаpredict
    Классификатор нейронной сетиpredict
    Классификатор машины опорных векторовpredict
    Дерево выбора из двух альтернатив для классификации мультиклассовpredict

    Расширенные возможности

    Введенный в R2011a