excludedata

Исключить данные из подгонки

Описание

пример

tf = excludedata(x,y,'box',box) возвращает логический массив, который указывает, какие элементы находятся вне поля в плоскости xy, заданной как box. Элементы tf равен 1 для точек данных за пределами блока и 0 для точек данных внутри блока. Чтобы исключить данные при подгонке кривой с помощью fit, задайте tf как 'Exclude' значение.

пример

tf = excludedata(x,y,'domain',domain) определяет точки данных, которые имеют x-значения вне интервала domain.

пример

tf = excludedata(x,y,'range',range) определяет точки данных с y-значения вне интервала range.

tf = excludedata(x,y,'indices',indices) определяет точки данных с индексами, равными indices.

Примеры

свернуть все

Визуализируйте правила исключения с помощью случайных данных.

Сгенерируйте случайные x и y данные.

xdata = -3 + 6*rand(1,1e4);
ydata = -3 + 6*rand(1,1e4);

В качестве примера исключить данные, которые находятся либо внутри коробки [-1 1 -1 1] или за пределами области [-2 2].

outliers1 = ~excludedata(xdata,ydata,'box',[-1 1 -1 1]);
outliers2 = excludedata(xdata,ydata,'domain',[-2 2]);
outliers = outliers1|outliers2;

Постройте график данных, которые не исключены. Белая область соответствует областям, которые исключены.

plot(xdata(~outliers),ydata(~outliers),'.')
axis([-3 3 -3 3])
axis square

Figure contains an axes. The axes contains an object of type line.

Загрузите подсчет голосов и имен округа для состояния Флориды с президентских выборов 2000 года.

load flvote2k

Используйте подсчет голосов для двух основных кандидатов от партии, Буша и Гора, в качестве предикторов подсчета голосов для стороннего кандидата Бьюкенена и постройте график разбросов:

plot(bush,buchanan,'rs')
hold on
plot(gore,buchanan,'bo')
legend('Bush data','Gore data')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent Bush data, Gore data.

Предположим, что модель, в которой фиксированная доля избирателей Буша или Гора выбирает голосовать за Бьюкенена.

f = fittype({'x'})
f = 
     Linear model:
     f(a,x) = a*x

Исключить данные заочных избирателей, которые не использовали спорный бюллетень «бабочка».

nobutterfly = strcmp(counties,'Absentee Ballots');

Выполните устойчивую подгонку весов bisquare модели к двум наборам данных, исключая заочных избирателей.

bushfit = fit(bush,buchanan,f,'Exclude',nobutterfly,'Robust','on');
gorefit = fit(gore,buchanan,f,'Exclude',nobutterfly,'Robust','on');

Устойчивые подгонки дают выбросам низкий вес, поэтому большие невязки от устойчивой подгонки могут использоваться, чтобы идентифицировать выбросы.

figure
plot(bushfit,bush,buchanan,'rs','residuals')
hold on
plot(gorefit,gore,buchanan,'bo','residuals')

Figure contains an axes. The axes contains 4 objects of type line. These objects represent data, zero line.

Вычислите невязки.

bushres = buchanan - feval(bushfit,bush);
goreres = buchanan - feval(gorefit,gore);

Идентифицируйте большие невязки как те, которые находятся вне области значений [-500 500].

bushoutliers = excludedata(bush,bushres,'range',[-500 500]);
goreoutliers = excludedata(gore,goreres,'range',[-500 500]);

Отображение округов, соответствующих выбросам. Округа Майами-Дейд и Брауард соответствуют самым большим значениям предиктора. Округ Палм-Бич, единственный округ в состояние, использующий бюллетень «бабочка», соответствует самым большим значениям невязки.

counties(bushoutliers)
ans = 2x1 cell
    {'Miami-Dade'}
    {'Palm Beach'}

counties(goreoutliers)
ans = 3x1 cell
    {'Broward'   }
    {'Miami-Dade'}
    {'Palm Beach'}

Входные параметры

свернуть все

Сайты данных значений данных, заданные как числовой вектор.

Значения данных, заданные как числовой вектор.

Прямоугольник для поиска данных вне, заданный как числовой вектор [xmin xmax ymin ymax] с четырьмя элементами.

Пример: [-1 1 0 2]

Область, чтобы найти данные вне, заданный как числовой вектор [xmin xmax] с двумя элементами.

Пример: [-1 1]

Область значений, чтобы найти данные вне, заданный как числовой вектор [ymin ymax] с двумя элементами.

Пример: [3 4]

Индексы точек данных для поиска, заданные как числовой вектор.

Пример: [3 7 9]

См. также

|

Представлено до R2006a