Загрузите подсчеты голосов и имена графства для Флориды от 2 000 американских президентских выборов.
Используйте подсчеты голосов для двух крупных партийных кандидатов, Буша и Гора, как предикторы для подсчетов голосов для стороннего кандидата Бьюкенена, и постройте рассеяния:
Примите модель, где фиксированная пропорция избирателей Буша или Гора принимает решение голосовать за Бьюкенен.
f =
Linear model:
f(a,x) = a*x
Исключите данные от голосующих по открепительному талону, которые не использовали спорные выборы “бабочки”.
Выполните bisquare веса устойчивый припадок модели к этим двум наборам данных, исключая голосующих по открепительному талону.
Устойчивые подгонки дают выбросам низкий вес, таким образом, большие остаточные значения устойчивой подгонки могут использоваться, чтобы идентифицировать выбросы.
Вычислите остаточные значения.
Идентифицируйте большие остаточные значения как тех вне области значений [-500 500].
Отобразите округа, соответствующие выбросам. Округ Майами-Дэйд и округ Бровард соответствуют самым большим значениям предиктора. Округ Палм-Бич, единственное графство в состоянии, чтобы использовать выборы “бабочки”, соответствует самым большим остаточным значениям.
ans = 2x1 cell
{'Miami-Dade'}
{'Palm Beach'}
ans = 3x1 cell
{'Broward' }
{'Miami-Dade'}
{'Palm Beach'}