предсказать

Предскажите метки с помощью модели классификации дискриминантных анализов

Синтаксис

label = predict(Mdl,X)

[label,score,cost]
= predict(Mdl,X)

Описание

label = predict(Mdl,X) возвращает вектор предсказанных меток класса для данных о предикторе в таблице или матричном X, на основе обученной модели Mdl классификации дискриминантных анализов.

[label,score,cost] = predict(Mdl,X) также возвращается:

Матрица очков классификации (score), указывающий на вероятность, что метка прибывает из конкретного класса. Для дискриминантного анализа очки являются апостериорными вероятностями.
Матрица ожидаемой классификации стоила (cost). Для каждого наблюдения в X предсказанная метка класса соответствует минимальной ожидаемой стоимости классификации среди всех классов.

Входные параметры

развернуть все

`Mdl` — Модель классификации дискриминантных анализов
Объект модели `ClassificationDiscriminant` | объект модели `CompactClassificationDiscriminant`

Модель классификации дискриминантных анализов, заданная как ClassificationDiscriminant или объект модели CompactClassificationDiscriminant, возвращенный fitcdiscr.

`X` Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

Данные о предикторе, которые будут классифицированы, заданные как числовая матрица или таблица.

Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной. Все переменные прогноза в X должны быть числовыми векторами.

Для числовой матрицы переменные, которые составляют столбцы X, должны иметь тот же порядок как переменные прогноза, которые обучили Mdl.
Для таблицы:
- predict не поддерживает многостолбцовые переменные и массивы ячеек кроме массивов ячеек из символьных векторов.
- Если бы вы обучили Mdl с помощью таблицы (например, Tbl), то все переменные прогноза в X должны иметь те же имена переменных и типы данных как те, которые обучили Mdl (сохраненный в Mdl.PredictorNames). Однако порядок следования столбцов X не должен соответствовать порядку следования столбцов Tbl. Tbl и X могут содержать дополнительные переменные (переменные отклика, веса наблюдения, и т.д.), но predict игнорирует их.
- Если бы вы обучили Mdl с помощью числовой матрицы, то имена предиктора в Mdl.PredictorNames и соответствующие имена переменной прогноза в X должны быть тем же самым. Чтобы задать имена предиктора во время обучения, смотрите аргумент пары "имя-значение" PredictorNames fitcdiscr. X может содержать дополнительные переменные (переменные отклика, веса наблюдения, и т.д.), но predict игнорирует их.

Типы данных: table | double | single

Выходные аргументы

развернуть все

`метка` Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

Предсказанные метки класса, возвращенные как категориальное или символьный массив, логический или числовой вектор или массив ячеек из символьных векторов.

метка:

Совпадающий тип данных, когда наблюдаемый класс маркирует (Y), который обучил Mdl. (Программное обеспечение обрабатывает строковые массивы как массивы ячеек из символьных векторов.)
Имеет длину, равную количеству строк X.

`score` — Предсказанные апостериорные вероятности класса
числовая матрица

Предсказанные апостериорные вероятности класса, возвращенные как числовая матрица размера N-by-K. N является количеством наблюдений (строки) в X, и K является количеством классов (в Mdl.ClassNames). score(i,j) является апостериорной вероятностью, что наблюдение i в X имеет класс j в Mdl.ClassNames.

`cost` — Ожидаемые затраты классификации
числовая матрица

Ожидаемые затраты классификации, возвращенные как матрица размера N-by-K. N является количеством наблюдений (строки) в X, и K является количеством классов (в Mdl.ClassNames). cost(i,j) является стоимостью классификации строки i X как класс j в Mdl.ClassNames.

Примеры

развернуть все

Предскажите метки класса Используя модель дискриминантного анализа

Скрипт Open Live Script

Загрузите ирисовый набор данных Фишера. Определите объем выборки.

load fisheriris
N = size(meas,1);

Разделите данные в наборы обучающих данных и наборы тестов. Протяните 10% данных для тестирования.

rng(1); % For reproducibility
cvp = cvpartition(N,'Holdout',0.1);
idxTrn = training(cvp); % Training set indices
idxTest = test(cvp);    % Test set indices

Храните данные тренировки в таблице.

tblTrn = array2table(meas(idxTrn,:));
tblTrn.Y = species(idxTrn);

Обучите модель дискриминантного анализа использование набора обучающих данных и опций по умолчанию.

Mdl = fitcdiscr(tblTrn,'Y');

Предскажите метки для набора тестов. Вы обучили Mdl с помощью таблицы данных, но можно предсказать метки с помощью матрицы.

labels = predict(Mdl,meas(idxTest,:));

Создайте матрицу беспорядка для набора тестов.

confusionchart(species(idxTest),labels);

Mdl неправильно классифицирует одну ирисовую диафрагму versicolor как virginica в наборе тестов.

Постройте области апостериорной вероятности класса

Скрипт Open Live Script

Загрузите ирисовый набор данных Фишера. Рассмотрите обучение с помощью лепестковых длин и ширин только.

load fisheriris
X = meas(:,3:4);

Обучите квадратичную модель дискриминантного анализа использование целого набора данных.

Mdl = fitcdiscr(X,species,'DiscrimType','quadratic');

Задайте сетку значений на наблюдаемом пробеле предиктора. Предскажите апостериорные вероятности для каждого экземпляра в сетке.

xMax = max(X);
xMin = min(X);
d = 0.01;
[x1Grid,x2Grid] = meshgrid(xMin(1):d:xMax(1),xMin(2):d:xMax(2));

[~,score] = predict(Mdl,[x1Grid(:),x2Grid(:)]);
Mdl.ClassNames

ans = 3x1 cell array
    {'setosa'    }
    {'versicolor'}
    {'virginica' }

score является матрицей апостериорных вероятностей класса. Столбцы соответствуют классам в Mdl.ClassNames. Например, score(j,1) является апостериорной вероятностью, что наблюдение j является ирисовой диафрагмой setosa.

Постройте апостериорную вероятность versicolor классификации для каждого наблюдения в сетке и отобразите данные тренировки на графике.

figure;
contourf(x1Grid,x2Grid,reshape(score(:,2),size(x1Grid,1),size(x1Grid,2)));
h = colorbar;
caxis([0 1]);
colormap jet;
hold on
gscatter(X(:,1),X(:,2),species,'mcy','.x+');
axis tight
title('Posterior Probability of versicolor'); 
hold off

Область апостериорной вероятности представляет фрагмент контура решения.

Больше о

развернуть все

Апостериорная вероятность

Апостериорная вероятность, что точка z принадлежит, чтобы классифицировать j, является продуктом априорной вероятности и многомерной нормальной плотности. Функция плотности многомерного нормального со средним _μj и ковариацией Σ_j в точке z

$P (x | k) = \frac{1}{{(2 π | Σ_{k} |)}^{1 / 2}} \exp (- \frac{}{12} {(x - μ_{k})}^{T} Σ_{k}^{- 1} (x - μ_{k})),$

где $| Σ_{k} |$ детерминант Σ_k, и $Σ_{k}^{- 1}$ обратная матрица.

Позволенный P (k) представляют априорную вероятность класса k. Затем апостериорная вероятность, что наблюдение x имеет класс k,

$\hat{P} (k | x) = \frac{P (x | k) P (k)}{P (x)},$

где P (x) является постоянной нормализацией, сумма по k P (x |k) P (k).

Априорная вероятность

Априорная вероятность является одним из трех вариантов:

'uniform' — Априорная вероятность класса k один по общему количеству классов.
'empirical' — Априорная вероятность класса k является количеством учебных выборок класса k, разделенный на общее количество учебных выборок.
Пользовательский — априорная вероятность класса k является k th элемент вектора prior. Смотрите fitcdiscr.

После создания модели классификации (Mdl) можно установить предшествующую запись через точку использования:

Mdl.Prior = v;

где v является вектором положительных элементов, представляющих частоту, с которой происходит каждый элемент. Вы не должны переобучать классификатор, когда вы устанавливаете новое предшествующее.

Стоимость

Матрица ожидаемых затрат на наблюдение задана в Стоимости.

Предсказанная метка класса

predict классифицирует, чтобы минимизировать ожидаемую стоимость классификации:

$\hat{y} = \underset{y = 1, ..., K}{аргумент \min} \sum_{k = 1}^{K} \hat{P} (k | x) C (y | k),$

где

$\hat{y}$ предсказанная классификация.
K является количеством классов.
$\hat{P} (k | x)$ апостериорная вероятность класса k для наблюдения x.
$C (y | k)$ стоимость классификации наблюдения как y, когда его истинным классом является k.

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Эта функция полностью поддерживает "высокие" массивы. Для получения дополнительной информации смотрите Длинные массивы (MATLAB).

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

Используйте saveCompactModel, loadCompactModel и codegen, чтобы сгенерировать код для функции predict. Сохраните обученную модель при помощи saveCompactModel. Задайте функцию точки входа, которая загружает сохраненную модель при помощи loadCompactModel и вызывает функцию predict. Затем используйте codegen, чтобы сгенерировать код для функции точки входа.

Эта таблица содержит примечания об аргументах predict. Аргументы, не включенные в эту таблицу, полностью поддержаны.

Аргумент Примечания и ограничения

Аргумент	Примечания и ограничения
`Mdl`	Для указаний и ограничений по применению объекта модели смотрите Генерацию кода объекта `CompactClassificationDiscriminant`.
`X`	Должен быть матрица с двойной точностью или с одинарной точностью и может быть переменный размер. Однако количеством столбцов в `X` должен быть `numel(Mdl.PredictorNames)`. Строки и столбцы должны соответствовать наблюдениям и предикторам, соответственно.

Mdl

Для указаний и ограничений по применению объекта модели смотрите Генерацию кода объекта CompactClassificationDiscriminant.

X

Должен быть матрица с двойной точностью или с одинарной точностью и может быть переменный размер. Однако количеством столбцов в X должен быть numel(Mdl.PredictorNames).
Строки и столбцы должны соответствовать наблюдениям и предикторам, соответственно.

Для получения дополнительной информации смотрите Введение в Генерацию кода.

Документация

предсказать

Синтаксис

Описание

Входные параметры

`Mdl` — Модель классификации дискриминантных анализов
Объект модели `ClassificationDiscriminant` | объект модели `CompactClassificationDiscriminant`

`X` Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

Выходные аргументы

`метка` Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

`score` — Предсказанные апостериорные вероятности класса
числовая матрица

`cost` — Ожидаемые затраты классификации
числовая матрица

Примеры

Предскажите метки класса Используя модель дискриминантного анализа

Постройте области апостериорной вероятности класса

Больше о

Апостериорная вероятность

Априорная вероятность

Стоимость

Предсказанная метка класса

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2011b

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

предсказать

Синтаксис

Описание

Входные параметры

Mdl — Модель классификации дискриминантных анализов Объект модели ClassificationDiscriminant | объект модели CompactClassificationDiscriminant

X Данные о предикторе, которые будут классифицированы числовая матрица | таблица

Выходные аргументы

метка Предсказанные метки класса категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

score — Предсказанные апостериорные вероятности класса числовая матрица

cost — Ожидаемые затраты классификации числовая матрица

Примеры

Предскажите метки класса Используя модель дискриминантного анализа

Постройте области апостериорной вероятности класса

Больше о

Апостериорная вероятность

Априорная вероятность

Стоимость

Предсказанная метка класса

Расширенные возможности

"Высокие" массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2011b

Документация Statistics and Machine Learning Toolbox

Поддержка

`Mdl` — Модель классификации дискриминантных анализов
Объект модели `ClassificationDiscriminant` | объект модели `CompactClassificationDiscriminant`

`X` Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

`метка` Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

`score` — Предсказанные апостериорные вероятности класса
числовая матрица

`cost` — Ожидаемые затраты классификации
числовая матрица

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.