excludedata

Исключите данные из подгонки

Описание

пример

tf = excludedata(x,y,'box',box) возвращает логический массив, который указывает, какие элементы находятся вне поля в xy-плоскости, заданной box. Элементы tf равняйтесь 1 для точек данных вне поля и 0 для точек данных в поле. Исключить данные при подборе кривой использованию кривой fit, задайте tf как 'Exclude' значение.

пример

tf = excludedata(x,y,'domain',domain) идентифицирует точки данных, которые имеют x- значения вне интервала domain.

пример

tf = excludedata(x,y,'range',range) идентифицирует точки данных с y- значения вне интервала range.

tf = excludedata(x,y,'indices',indices) идентифицирует точки данных с индексами, равными indices.

Примеры

свернуть все

Визуализируйте правила исключения с помощью случайных данных.

Сгенерируйте случайный x и y данные.

xdata = -3 + 6*rand(1,1e4);
ydata = -3 + 6*rand(1,1e4);

Как пример, исключите данные, которые являются любой в поле [-1 1 -1 1] или вне доменного [-2 2].

outliers1 = ~excludedata(xdata,ydata,'box',[-1 1 -1 1]);
outliers2 = excludedata(xdata,ydata,'domain',[-2 2]);
outliers = outliers1|outliers2;

Отобразите на графике данные, которые не исключены. Белая область соответствует областям, которые исключены.

plot(xdata(~outliers),ydata(~outliers),'.')
axis([-3 3 -3 3])
axis square

Figure contains an axes. The axes contains an object of type line.

Загрузите подсчеты голосов и имена графства для Флориды от 2 000 американских президентских выборов.

load flvote2k

Используйте подсчеты голосов для двух крупных партийных кандидатов, Буша и Гора, как предикторы для подсчетов голосов для стороннего кандидата Бьюкенена, и постройте рассеяния:

plot(bush,buchanan,'rs')
hold on
plot(gore,buchanan,'bo')
legend('Bush data','Gore data')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent Bush data, Gore data.

Примите модель, где фиксированная пропорция избирателей Буша или Гора принимает решение голосовать за Бьюкенен.

f = fittype({'x'})
f = 
     Linear model:
     f(a,x) = a*x

Исключите данные от голосующих по открепительному талону, которые не использовали спорные выборы “бабочки”.

nobutterfly = strcmp(counties,'Absentee Ballots');

Выполните bisquare веса устойчивый припадок модели к этим двум наборам данных, исключая голосующих по открепительному талону.

bushfit = fit(bush,buchanan,f,'Exclude',nobutterfly,'Robust','on');
gorefit = fit(gore,buchanan,f,'Exclude',nobutterfly,'Robust','on');

Устойчивые подгонки дают выбросам низкий вес, таким образом, большие остаточные значения устойчивой подгонки могут использоваться, чтобы идентифицировать выбросы.

figure
plot(bushfit,bush,buchanan,'rs','residuals')
hold on
plot(gorefit,gore,buchanan,'bo','residuals')

Figure contains an axes. The axes contains 4 objects of type line. These objects represent data, zero line.

Вычислите остаточные значения.

bushres = buchanan - feval(bushfit,bush);
goreres = buchanan - feval(gorefit,gore);

Идентифицируйте большие остаточные значения как тех вне области значений [-500 500].

bushoutliers = excludedata(bush,bushres,'range',[-500 500]);
goreoutliers = excludedata(gore,goreres,'range',[-500 500]);

Отобразите округа, соответствующие выбросам. Округ Майами-Дэйд и округ Бровард соответствуют самым большим значениям предиктора. Округ Палм-Бич, единственное графство в состоянии, чтобы использовать выборы “бабочки”, соответствует самым большим остаточным значениям.

counties(bushoutliers)
ans = 2x1 cell
    {'Miami-Dade'}
    {'Palm Beach'}

counties(goreoutliers)
ans = 3x1 cell
    {'Broward'   }
    {'Miami-Dade'}
    {'Palm Beach'}

Входные параметры

свернуть все

Сайты данных значений данных в виде числового вектора.

Значения данных в виде числового вектора.

Поле, чтобы найти данные за пределами в виде числового векторного [xmin xmax ymin ymax] с четырьмя элементами.

Пример: [-1 1 0 2]

Область, чтобы найти данные за пределами в виде числового векторного [xmin xmax] с двумя элементами.

Пример: [-1 1]

Расположитесь, чтобы найти данные за пределами в виде числового векторного [ymin ymax] с двумя элементами.

Пример: [3 4]

Индексы точек данных, чтобы найти в виде числового вектора.

Пример: [3 7 9]

Смотрите также

|

Представлено до R2006a