exponenta event banner

excludedata

Исключить данные из посадки

Описание

пример

tf = excludedata(x,y,'box',box) возвращает логический массив, который указывает, какие элементы находятся вне поля в плоскости xy, указанной box. Элементы tf равно 1 для точек данных вне поля и 0 для точек данных внутри поля. Исключение данных при подгонке кривой с помощью fit, указать tf в качестве 'Exclude' значение.

пример

tf = excludedata(x,y,'domain',domain) идентифицирует точки данных, которые имеют x-значения за пределами интервала domain.

пример

tf = excludedata(x,y,'range',range) идентифицирует точки данных с помощью y-значения за пределами интервала range.

tf = excludedata(x,y,'indices',indices) идентифицирует точки данных с индексами, равными indices.

Примеры

свернуть все

Визуализация правил исключения с использованием случайных данных.

Генерировать случайные x и y данные.

xdata = -3 + 6*rand(1,1e4);
ydata = -3 + 6*rand(1,1e4);

В качестве примера исключите данные, которые находятся внутри поля [-1 1 -1 1] или вне домена [-2 2].

outliers1 = ~excludedata(xdata,ydata,'box',[-1 1 -1 1]);
outliers2 = excludedata(xdata,ydata,'domain',[-2 2]);
outliers = outliers1|outliers2;

Постройте график данных, которые не исключаются. Белая область соответствует исключенным областям.

plot(xdata(~outliers),ydata(~outliers),'.')
axis([-3 3 -3 3])
axis square

Figure contains an axes. The axes contains an object of type line.

Загрузите подсчет голосов и названия округов для штата Флорида с президентских выборов 2000 года в США.

load flvote2k

Используйте подсчет голосов для двух основных кандидатов от партии, Буша и Гора, в качестве предикторов подсчета голосов для стороннего кандидата Бьюкенена, и постройте график рассеяния:

plot(bush,buchanan,'rs')
hold on
plot(gore,buchanan,'bo')
legend('Bush data','Gore data')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent Bush data, Gore data.

Предположим, модель, в которой фиксированная доля избирателей Буша или Гора выбирает голосовать за Бьюкенена.

f = fittype({'x'})
f = 
     Linear model:
     f(a,x) = a*x

Исключить данные у открепительных избирателей, которые не воспользовались спорным бюллетенем «бабочка».

nobutterfly = strcmp(counties,'Absentee Ballots');

Выполните жесткую подгонку весов bisquare модели к двум наборам данных, исключая заочных избирателей.

bushfit = fit(bush,buchanan,f,'Exclude',nobutterfly,'Robust','on');
gorefit = fit(gore,buchanan,f,'Exclude',nobutterfly,'Robust','on');

Надежная посадка дает выходам низкий вес, поэтому большие остатки от надежной посадки могут быть использованы для идентификации выходов.

figure
plot(bushfit,bush,buchanan,'rs','residuals')
hold on
plot(gorefit,gore,buchanan,'bo','residuals')

Figure contains an axes. The axes contains 4 objects of type line. These objects represent data, zero line.

Вычислите остатки.

bushres = buchanan - feval(bushfit,bush);
goreres = buchanan - feval(gorefit,gore);

Определите большие остатки как находящиеся вне диапазона [-500 500].

bushoutliers = excludedata(bush,bushres,'range',[-500 500]);
goreoutliers = excludedata(gore,goreres,'range',[-500 500]);

Отображение графств, соответствующих отклонениям. Округа Майами-Дейд и Броуард соответствуют наибольшим предикторным значениям. Округ Палм-Бич, единственный округ штата, использовавший бюллетень «бабочка», соответствует наибольшим остаточным значениям.

counties(bushoutliers)
ans = 2x1 cell
    {'Miami-Dade'}
    {'Palm Beach'}

counties(goreoutliers)
ans = 3x1 cell
    {'Broward'   }
    {'Miami-Dade'}
    {'Palm Beach'}

Входные аргументы

свернуть все

Сайты данных значений данных, указанных как числовой вектор.

Значения данных, заданные как числовой вектор.

Поле для поиска данных за пределами, указанного как числовой вектор [xmin xmax ymin ymax] с четырьмя элементами.

Пример: [-1 1 0 2]

Домен для поиска данных за пределами, указанный как числовой вектор [xmin xmax] с двумя элементами.

Пример: [-1 1]

Диапазон для поиска данных за пределами, указанный как числовой вектор [ymin ymax] с двумя элементами.

Пример: [3 4]

Индексы найденных точек данных, заданные как числовой вектор.

Пример: [3 7 9]

См. также

|

Представлен до R2006a