predict

Предскажите метки с помощью модели классификации дискриминантных анализов

Синтаксис

label = predict(Mdl,X)

[label,score,cost]
= predict(Mdl,X)

Описание

label = predict(Mdl,X) возвращает вектор предсказанных меток класса для данных о предикторе в таблице или матричном X, на основе обученной модели Mdl классификации дискриминантных анализов.

[label,score,cost] = predict(Mdl,X) также возвращается:

Матрица A классификационных оценок (score) указание на вероятность, что метка прибывает из конкретного класса. Для дискриминантного анализа баллы являются апостериорными вероятностями.
Матрица A ожидаемой стоимости классификации (cost). Для каждого наблюдения в X, предсказанная метка класса соответствует минимальной ожидаемой стоимости классификации среди всех классов.

Входные параметры

развернуть все

`Mdl` — Модель классификации дискриминантных анализов
`ClassificationDiscriminant` объект модели | `CompactClassificationDiscriminant` объект модели

Модель классификации дискриминантных анализов в виде ClassificationDiscriminant или CompactClassificationDiscriminant объект модели возвращен fitcdiscr.

`X` — Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

Данные о предикторе, которые будут классифицированы в виде числовой матрицы или таблицы.

Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной. Все переменные предикторы в X должны быть числовые векторы.

Для числовой матрицы, переменные, которые составляют столбцы X должен иметь тот же порядок как переменные предикторы, которые обучили Mdl.
Для таблицы:
- predict не поддерживает многостолбцовые переменные и массивы ячеек кроме массивов ячеек из символьных векторов.
- Если вы обучили Mdl с помощью таблицы (например, Tbl), затем все переменные предикторы в X должен иметь те же имена переменных и типы данных как те, которые обучили Mdl (сохраненный в Mdl.PredictorNames). Однако порядок следования столбцов X не должен соответствовать порядку следования столбцов Tbltbl и X может содержать дополнительные переменные (переменные отклика, веса наблюдения, и т.д.), но predict игнорирует их.
- Если вы обучили Mdl с помощью числовой матрицы затем предиктор называет в Mdl.PredictorNames и соответствующий переменный предиктор называет в X должно быть то же самое. Чтобы задать имена предиктора во время обучения, смотрите PredictorNames аргумент пары "имя-значение" fitcdiscrX может содержать дополнительные переменные (переменные отклика, веса наблюдения, и т.д.), но predict игнорирует их.

Типы данных: table | double | single

Выходные аргументы

развернуть все

`label` — Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

Предсказанные метки класса, возвращенные как категориальное или символьный массив, логический или числовой вектор или массив ячеек из символьных векторов.

label:

Совпадающий тип данных, когда наблюдаемый класс помечает (Y) это обучило Mdl. (Программное обеспечение обрабатывает строковые массивы как массивы ячеек из символьных векторов.)
Имеет длину, равную количеству строк X.

`score` — Предсказанные апостериорные вероятности класса
числовая матрица

Предсказанные апостериорные вероятности класса, возвращенные как числовая матрица размера N- KN количество наблюдений (строки) в X, и K количество классов (в Mdl.ClassNames). score(i,j) апостериорная вероятность то наблюдение i в X имеет класс j в Mdl.ClassNames.

`cost` — Ожидаемые затраты классификации
числовая матрица

Ожидаемые затраты классификации, возвращенные как матрица размера N- KN количество наблюдений (строки) в X, и K количество классов (в Mdl.ClassNames). cost(i,j) стоимость классификации строки i из X как класс j в Mdl.ClassNames.

Примеры

развернуть все

Предскажите метки класса Используя модель дискриминантного анализа

Скрипт Open Live Script

Загрузите ирисовый набор данных Фишера. Определите объем выборки.

load fisheriris
N = size(meas,1);

Разделите данные в наборы обучающих данных и наборы тестов. Протяните 10% данных для тестирования.

rng(1); % For reproducibility
cvp = cvpartition(N,'Holdout',0.1);
idxTrn = training(cvp); % Training set indices
idxTest = test(cvp);    % Test set indices

Храните обучающие данные в таблице.

tblTrn = array2table(meas(idxTrn,:));
tblTrn.Y = species(idxTrn);

Обучите модель дискриминантного анализа использование набора обучающих данных и опций по умолчанию.

Mdl = fitcdiscr(tblTrn,'Y');

Предскажите метки для набора тестов. Вы обучили Mdl с помощью таблицы данных, но можно предсказать метки с помощью матрицы.

labels = predict(Mdl,meas(idxTest,:));

Создайте матрицу беспорядка для набора тестов.

confusionchart(species(idxTest),labels)

Mdl неправильно классифицирует одну ирисовую диафрагму versicolor как virginica в наборе тестов.

Постройте области апостериорной вероятности класса

Скрипт Open Live Script

Загрузите ирисовый набор данных Фишера. Рассмотрите обучение с помощью лепестковых длин и ширин только.

load fisheriris
X = meas(:,3:4);

Обучите квадратичную модель дискриминантного анализа использование целого набора данных.

Mdl = fitcdiscr(X,species,'DiscrimType','quadratic');

Задайте сетку значений на наблюдаемом пробеле предиктора. Предскажите апостериорные вероятности для каждого экземпляра в сетке.

xMax = max(X);
xMin = min(X);
d = 0.01;
[x1Grid,x2Grid] = meshgrid(xMin(1):d:xMax(1),xMin(2):d:xMax(2));

[~,score] = predict(Mdl,[x1Grid(:),x2Grid(:)]);
Mdl.ClassNames

ans = 3x1 cell
    {'setosa'    }
    {'versicolor'}
    {'virginica' }

score матрица апостериорных вероятностей класса. Столбцы соответствуют классам в Mdl.ClassNames. Например, score(j,1) апостериорная вероятность то наблюдение j ирисовая диафрагма setosa.

Постройте апостериорную вероятность versicolor классификации для каждого наблюдения в сетке и отобразите обучающие данные на графике.

figure;
contourf(x1Grid,x2Grid,reshape(score(:,2),size(x1Grid,1),size(x1Grid,2)));
h = colorbar;
caxis([0 1]);
colormap jet;
hold on
gscatter(X(:,1),X(:,2),species,'mcy','.x+');
axis tight
title('Posterior Probability of versicolor'); 
hold off

Область апостериорной вероятности отсоединяет фрагмент контура решения.

Больше о

развернуть все

Апостериорная вероятность

Апостериорная вероятность, что точка x принадлежит, чтобы классифицировать k, является продуктом априорной вероятности и многомерной нормальной плотности. Функция плотности многомерного нормального с 1 d означает_{, что μk} и d-by-d ковариация Σ_k в 1 d указывают, что x

$P (x | k) = \frac{1}{{({(2 π)}^{d} | Σ_{k} |)}^{1 / 2}} \exp (- \frac{1}{2} (x - μ_{k}) Σ_{k}^{- 1} {(x - μ_{k})}^{T}),$

где $| Σ_{k} |$ определитель Σ_k, и $Σ_{k}^{- 1}$ обратная матрица.

Позволенный P (k) представляют априорную вероятность класса k. Затем апостериорная вероятность, что наблюдение x имеет класс k,

$\hat{P} (k | x) = \frac{P (x | k) P (k)}{P (x)},$

где P (x) является постоянной нормализацией, сумма по k P (x |k) P (k).

Априорная вероятность

Априорная вероятность является одним из трех вариантов:

'uniform' — Априорная вероятность класса k один по общему количеству классов.
'empirical' — Априорная вероятность класса k количество обучающих выборок класса k разделенный на общее количество обучающих выборок.
Пользовательский — априорная вероятность класса k kэлемент th prior вектор. Смотрите fitcdiscr.

После создания модели классификации (Mdl) можно установить предшествующую запись через точку использования:

Mdl.Prior = v;

где v вектор положительных элементов, представляющих частоту, с которой происходит каждый элемент. Вы не должны переобучать классификатор, когда вы устанавливаете новое предшествующее.

Стоимость

Матрица ожидаемых затрат на наблюдение задана в Стоимости.

Предсказанная метка класса

predict классифицирует, чтобы минимизировать ожидаемую стоимость классификации:

$\hat{y} = \underset{y = 1, ..., K}{\arg \min} \sum_{k = 1}^{K} \hat{P} (k | x) C (y | k),$

где

$\hat{y}$ предсказанная классификация.
K является количеством классов.
$\hat{P} (k | x)$ апостериорная вероятность класса k для наблюдения x.
$C (y | k)$ стоимость классификации наблюдения как y, когда его истинным классом является k.

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Эта функция полностью поддерживает "высокие" массивы. Можно использовать модели, обученные или на или на высоких данных в оперативной памяти с этой функцией.

Для получения дополнительной информации смотрите Длинные массивы (MATLAB).

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

Используйте saveLearnerForCoder, loadLearnerForCoder, и codegen сгенерировать код для predict функция. Сохраните обученную модель при помощи saveLearnerForCoder. Задайте функцию точки входа, которая загружает сохраненную модель при помощи loadLearnerForCoder и вызывает predict функция. Затем используйте codegen сгенерировать код для функции точки входа.

Эта таблица содержит примечания об аргументах predict. Аргументы, не включенные в эту таблицу, полностью поддержаны.

Аргумент Примечания и ограничения

Аргумент	Примечания и ограничения
`Mdl`	Для указаний и ограничений по применению объекта модели смотрите Генерацию кода `CompactClassificationDiscriminant` объект.
`X`	Для общей генерации кода, `X` должна быть матрица с двойной точностью или с одинарной точностью или таблица, содержащая `single` или `double` переменные предикторы. Если вы хотите задать `X` как таблица, затем ваша модель должна быть обучена с помощью таблицы, и необходимо гарантировать, что точка входа функционирует для предсказания: Принимает данные как массивы Составляет таблицу от аргументов ввода данных и задает имена переменных в таблице Передает таблицу `predict` Для примера этого табличного рабочего процесса смотрите, Генерируют Код, чтобы Классифицировать Числовые данные на Таблицу. Для получения дополнительной информации об использовании таблиц в генерации кода смотрите Генерацию кода для Таблиц (MATLAB Coder) и Табличные Ограничения для Генерации кода (MATLAB Coder). Количество строк или наблюдения, в `X` может быть переменный размер, но количество столбцов в `X` должен быть зафиксирован.

Mdl

Для указаний и ограничений по применению объекта модели смотрите Генерацию кода CompactClassificationDiscriminant объект.

X

Для общей генерации кода, X должна быть матрица с двойной точностью или с одинарной точностью или таблица, содержащая single или double переменные предикторы.
Если вы хотите задать X как таблица, затем ваша модель должна быть обучена с помощью таблицы, и необходимо гарантировать, что точка входа функционирует для предсказания:
- Принимает данные как массивы
- Составляет таблицу от аргументов ввода данных и задает имена переменных в таблице
- Передает таблицу predict
Для примера этого табличного рабочего процесса смотрите, Генерируют Код, чтобы Классифицировать Числовые данные на Таблицу. Для получения дополнительной информации об использовании таблиц в генерации кода смотрите Генерацию кода для Таблиц (MATLAB Coder) и Табличные Ограничения для Генерации кода (MATLAB Coder).
Количество строк или наблюдения, в X может быть переменный размер, но количество столбцов в X должен быть зафиксирован.

Для получения дополнительной информации смотрите Введение в Генерацию кода.

Документация

predict

Синтаксис

Описание

Входные параметры

`Mdl` — Модель классификации дискриминантных анализов
`ClassificationDiscriminant` объект модели | `CompactClassificationDiscriminant` объект модели

`X` — Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

Выходные аргументы

`label` — Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

`score` — Предсказанные апостериорные вероятности класса
числовая матрица

`cost` — Ожидаемые затраты классификации
числовая матрица

Примеры

Предскажите метки класса Используя модель дискриминантного анализа

Постройте области апостериорной вероятности класса

Больше о

Апостериорная вероятность

Априорная вероятность

Стоимость

Предсказанная метка класса

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2011b

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

predict

Синтаксис

Описание

Входные параметры

Mdl — Модель классификации дискриминантных анализов ClassificationDiscriminant объект модели | CompactClassificationDiscriminant объект модели

X — Данные о предикторе, которые будут классифицированы числовая матрица | таблица

Выходные аргументы

label — Предсказанные метки класса категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

score — Предсказанные апостериорные вероятности класса числовая матрица

cost — Ожидаемые затраты классификации числовая матрица

Примеры

Предскажите метки класса Используя модель дискриминантного анализа

Постройте области апостериорной вероятности класса

Больше о

Апостериорная вероятность

Априорная вероятность

Стоимость

Предсказанная метка класса

Расширенные возможности

"Высокие" массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2011b

Документация Statistics and Machine Learning Toolbox

Поддержка

`Mdl` — Модель классификации дискриминантных анализов
`ClassificationDiscriminant` объект модели | `CompactClassificationDiscriminant` объект модели

`X` — Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

`label` — Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

`score` — Предсказанные апостериорные вероятности класса
числовая матрица

`cost` — Ожидаемые затраты классификации
числовая матрица

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.