excludedata

Исключите данные из подгонки

Описание

пример

tf = excludedata(x,y,'box',box) возвращает логический массив, который указывает, какие элементы находятся вне поля в xy-плоскости, заданной box. Элементы tf равняйтесь 1 для точек данных вне поля и 0 для точек данных в поле. Исключить данные при подборе кривой использованию кривой fit, задайте tf как 'Exclude' значение.

пример

tf = excludedata(x,y,'domain',domain) идентифицирует точки данных, которые имеют x- значения вне интервала domain.

пример

tf = excludedata(x,y,'range',range) идентифицирует точки данных с y- значения вне интервала range.

tf = excludedata(x,y,'indices',indices) идентифицирует точки данных с индексами, равными indices.

Примеры

свернуть все

Визуализируйте правила исключения с помощью случайных данных.

Сгенерируйте случайный x и y данные.

xdata = -3 + 6*rand(1,1e4);
ydata = -3 + 6*rand(1,1e4);

Как пример, исключите данные, которые являются любой в поле [-1 1 -1 1] или вне доменного [-2 2].

outliers1 = ~excludedata(xdata,ydata,'box',[-1 1 -1 1]);
outliers2 = excludedata(xdata,ydata,'domain',[-2 2]);
outliers = outliers1|outliers2;

Отобразите на графике данные, которые не исключены. Белая область соответствует областям, которые исключены.

plot(xdata(~outliers),ydata(~outliers),'.')
axis([-3 3 -3 3])
axis square

Figure contains an axes object. The axes object contains an object of type line.

Загрузите подсчеты голосов и имена графства для Флориды от 2 000 американских президентских выборов.

load flvote2k

Используйте подсчеты голосов для двух крупных партийных кандидатов, Буша и Гора, как предикторы для подсчетов голосов для стороннего кандидата Бьюкенена, и постройте рассеяния:

plot(bush,buchanan,'rs')
hold on
plot(gore,buchanan,'bo')
legend('Bush data','Gore data')

Figure contains an axes object. The axes object contains 2 objects of type line. These objects represent Bush data, Gore data.

Примите модель, где фиксированная пропорция избирателей Буша или Гора принимает решение голосовать за Бьюкенен.

f = fittype({'x'})
f = 
     Linear model:
     f(a,x) = a*x

Исключите данные от голосующих по открепительному талону, которые не использовали спорные выборы “бабочки”.

nobutterfly = strcmp(counties,'Absentee Ballots');

Выполните bisquare веса устойчивый припадок модели к этим двум наборам данных, исключая голосующих по открепительному талону.

bushfit = fit(bush,buchanan,f,'Exclude',nobutterfly,'Robust','on');
gorefit = fit(gore,buchanan,f,'Exclude',nobutterfly,'Robust','on');

Устойчивые подгонки дают выбросам низкий вес, таким образом, большие остаточные значения устойчивой подгонки могут использоваться, чтобы идентифицировать выбросы.

figure
plot(bushfit,bush,buchanan,'rs','residuals')
hold on
plot(gorefit,gore,buchanan,'bo','residuals')

Figure contains an axes object. The axes object contains 4 objects of type line. These objects represent data, zero line.

Вычислите остаточные значения.

bushres = buchanan - feval(bushfit,bush);
goreres = buchanan - feval(gorefit,gore);

Идентифицируйте большие остаточные значения как тех вне области значений [-500 500].

bushoutliers = excludedata(bush,bushres,'range',[-500 500]);
goreoutliers = excludedata(gore,goreres,'range',[-500 500]);

Отобразите округа, соответствующие выбросам. Округ Майами-Дэйд и округ Бровард соответствуют самым большим значениям предиктора. Округ Палм-Бич, единственное графство в состоянии, чтобы использовать выборы “бабочки”, соответствует самым большим остаточным значениям.

counties(bushoutliers)
ans = 2x1 cell
    {'Miami-Dade'}
    {'Palm Beach'}

counties(goreoutliers)
ans = 3x1 cell
    {'Broward'   }
    {'Miami-Dade'}
    {'Palm Beach'}

Входные параметры

свернуть все

Сайты данных значений данных в виде числового вектора.

Значения данных в виде числового вектора.

Поле, чтобы найти данные за пределами в виде числового векторного [xmin xmax ymin ymax] с четырьмя элементами.

Пример: [-1 1 0 2]

Область, чтобы найти данные за пределами в виде числового векторного [xmin xmax] с двумя элементами.

Пример: [-1 1]

Расположитесь, чтобы найти данные за пределами в виде числового векторного [ymin ymax] с двумя элементами.

Пример: [3 4]

Индексы точек данных, чтобы найти в виде числового вектора.

Пример: [3 7 9]

Смотрите также

|

Представлено до R2006a