Загрузите подсчет голосов и имен округа для состояния Флориды с президентских выборов 2000 года.
Используйте подсчет голосов для двух основных кандидатов от партии, Буша и Гора, в качестве предикторов подсчета голосов для стороннего кандидата Бьюкенена и постройте график разбросов:
Предположим, что модель, в которой фиксированная доля избирателей Буша или Гора выбирает голосовать за Бьюкенена.
f =
Linear model:
f(a,x) = a*x
Исключить данные заочных избирателей, которые не использовали спорный бюллетень «бабочка».
Выполните устойчивую подгонку весов bisquare модели к двум наборам данных, исключая заочных избирателей.
Устойчивые подгонки дают выбросам низкий вес, поэтому большие невязки от устойчивой подгонки могут использоваться, чтобы идентифицировать выбросы.
Вычислите невязки.
Идентифицируйте большие невязки как те, которые находятся вне области значений [-500 500].
Отображение округов, соответствующих выбросам. Округа Майами-Дейд и Брауард соответствуют самым большим значениям предиктора. Округ Палм-Бич, единственный округ в состояние, использующий бюллетень «бабочка», соответствует самым большим значениям невязки.
ans = 2x1 cell
{'Miami-Dade'}
{'Palm Beach'}
ans = 3x1 cell
{'Broward' }
{'Miami-Dade'}
{'Palm Beach'}