Найдите, заполните или удалите выбросы в Live Editor
Чистая задача Данных о Выбросе позволяет вам в интерактивном режиме обработать выбросы в данных. Задача автоматически генерирует MATLAB® код для вашего live скрипта.
Используя эту задачу, вы можете:
Найдите, заполните или удалите выбросы из данных в переменной рабочей области.
Настройте методы для нахождения и заполнения выбросов.
Автоматически визуализируйте данные о выбросе и убранные данные.
Добавить Чистую задачу Данных о Выбросе в live скрипт в редакторе MATLAB:
На вкладке Live Editor выберите Task > Clean Outlier Data.
В блоке кода в скрипте введите соответствующее ключевое слово, такое как outlier
или clean
. Выберите Clean Outlier Data из предложенных завершений команды.
Input data
— Допустимые входные данные из рабочей областиЭта задача управляет на данных типа single
или double
содержавшийся в векторе или табличных переменных. Когда указание таблицы или расписания для входных данных, задайте All supported variables, чтобы убрать все переменные с типом single
или double
, или выберите который single
или double
переменные, чтобы убрать путем выбора Specified variables и затем выбора переменных индивидуально.
Cleaning method
— Очистка метода для заполнения выбросовLinear interpolation
(значение по умолчанию) | Constant value
| Center value
| Clip to threshold value
| Previous value
| Next value
| Nearest value
| Spline interpolation
| Shape-preserving cubic interpolation (PCHIP)
| Modified Akima cubic interpolation
| ...Задайте метод для заполнения выбросов с помощью одной из следующих опций.
Fillmethod | Описание |
---|---|
Linear interpolation | Линейная интерполяция соседних, значений невыброса. |
Constant value | Заданное скалярное значение, которое является 0 по умолчанию. |
Center value | Центральное значение определяется методом находки. |
Clip to threshold value | Заливки понижают пороговое значение для элементов, меньших, чем более низкий порог, определенный методом находки. Заливки с верхним пороговым значением для элементов, больше, чем верхний порог, определенный методом находки. |
Previous value | Предыдущее значение невыброса. |
Next value | Следующее значение невыброса. |
Nearest value | Самое близкое значение невыброса. |
Spline interpolation | Кусочная интерполяция кубическим сплайном. |
Shape-preserving cubic interpolation (PCHIP) | Сохраняющая форму кусочная интерполяция кубическим сплайном. |
Modified Akima cubic interpolation | Модифицированный Акима кубическая интерполяция Эрмита. |
Detection method
— Метод для обнаружения выбросовMoving median
(значение по умолчанию) | Median
| Mean
| Quartiles
| Grubbs
| Generalized extreme studentized deviate (GESD)
| Moving mean
| Percentiles
| ...Задайте метод обнаружения для нахождения выбросов с помощью одной из следующих опций.
Метод | Описание |
---|---|
Moving median | Выбросы заданы как элементы больше, чем заданный порог локального масштабированного MAD от локальной медианы по заданному окну. Порогом по умолчанию является 3 . |
Median | Выбросы заданы как элементы больше, чем заданный порог масштабированных средних абсолютных отклонений (MAD) от медианы, которая является 3 по умолчанию. Для входных данных A , масштабированный MAD задан как c*median(abs(A-median(A))) , где c=-1/(sqrt(2)*erfcinv(3/2)) . |
Mean | Выбросы заданы как элементы больше, чем заданный порог стандартных отклонений от среднего значения, которое является 3 по умолчанию. Этот метод быстрее, но менее устойчив, чем Median . |
Quartiles | Выбросы заданы как элементы больше, чем заданный порог межквартильных размахов выше верхнего квартиля (75 процентов) или ниже более низкого квартиля (25 процентов), который является 1.5 по умолчанию. Этот метод полезен, когда входные данные не нормально распределены. |
Grubbs | Выбросы обнаруживаются с помощью теста Граббса, который удаляет один выброс на итерацию на основе тестирования гипотезы. Этот метод принимает, что входные данные нормально распределены. |
Generalized extreme studentized deviate (GESD) | Выбросы обнаруживаются с помощью обобщенного экстремального значения studentized, отклоняют тест для выбросов. Этот итерационный метод похож на Grubbs , но может выполнить лучше, когда несколько выбросов маскируют друг друга. |
Moving mean | Выбросы заданы как элементы больше, чем заданный порог локальных стандартных отклонений от локального среднего значения по заданному окну. Порогом по умолчанию является 3 . |
Percentiles | Выбросы заданы как элементы за пределами диапазона процентили, указанного верхним и более низким порогом. Более низким порогом процентили по умолчанию является 10 и верхним порогом процентили по умолчанию является 90 . Допустимые пороговые значения находятся в интервале [0,100]. |
Moving window
— Окно для движущихся методовCentered
(значение по умолчанию) | Asymmetric
Задайте тип окна и размер, когда методом для обнаружения выбросов будет Moving median
или Moving mean
.
Окно | Описание |
---|---|
Centered | Заданная длина окна сосредоточена о текущей точке. |
Asymmetric | Заданное окно, содержащее число элементов перед текущей точкой и числом элементов после текущей точки. |
Размеры окна относительно модулей переменной X-axis.