Clean Outlier Data

Найдите, заполните или удалите выбросы в Live Editor

Описание

Чистая задача Данных о Выбросе позволяет вам в интерактивном режиме обработать выбросы в данных. Задача автоматически генерирует код MATLAB® для вашего live скрипта.

Используя эту задачу, вы можете:

  • Найдите, заполните или удалите выбросы из данных в переменной рабочей области.

  • Настройте методы для нахождения и заполнения выбросов.

  • Автоматически визуализируйте данные о выбросе и убранные данные.

Clean Outlier Data task in Live Editor

Откройте задачу

Добавить Чистую задачу Данных о Выбросе в live скрипт в редакторе MATLAB:

  • На вкладке Live Editor выберите Task > Clean Outlier Data.

  • В блоке кода в скрипте введите соответствующее ключевое слово, такое как outlier или clean. Выберите Clean Outlier Data из предложенных завершений команды.

Параметры

Задайте метод для заполнения выбросов с помощью одной из следующих опций.

Fillmethod Описание
Linear interpolationЛинейная интерполяция соседних, значений невыброса.
Constant valueЗаданное скалярное значение, которое является 0 по умолчанию.
Center valueЦентральное значение определяется методом находки.
Clip to threshold valueЗаливки понижают пороговое значение для элементов, меньших, чем более низкий порог, определенный методом находки. Заливки с верхним пороговым значением для элементов, больше, чем верхний порог, определенный методом находки.
Previous valueПредыдущее значение невыброса.
Next valueСледующее значение невыброса.
Nearest valueСамое близкое значение невыброса.
Spline interpolationКусочная интерполяция кубическим сплайном.
Shape-preserving cubic interpolation (PCHIP)Сохраняющая форму кусочная интерполяция кубическим сплайном.
Modified Akima cubic interpolationМодифицированный Акима кубическая интерполяция Эрмита.

Задайте метод обнаружения для нахождения выбросов с помощью одной из следующих опций.

МетодОписание
MedianВыбросы заданы как элементы больше, чем заданный порог масштабированных средних абсолютных отклонений (MAD) от медианы, которая является 3 по умолчанию. Для входных данных A, масштабированный MAD задан как c*median(abs(A-median(A))), где c=-1/(sqrt(2)*erfcinv(3/2)).
MeanВыбросы заданы как элементы больше, чем заданный порог стандартных отклонений от среднего значения, которое является 3 по умолчанию. Этот метод быстрее, но менее устойчив, чем Median.
QuartilesВыбросы заданы как элементы больше, чем заданный порог межквартильных размахов выше верхнего квартиля (75 процентов) или ниже более низкого квартиля (25 процентов), который является 1.5 по умолчанию. Этот метод полезен, когда входные данные не нормально распределены.
GrubbsВыбросы обнаруживаются с помощью теста Граббса, который удаляет один выброс на итерацию на основе тестирования гипотезы. Этот метод принимает, что входные данные нормально распределены.
Generalized extreme studentized deviate (GESD)Выбросы обнаруживаются с помощью обобщенного экстремального значения studentized, отклоняют тест для выбросов. Этот итерационный метод похож на Grubbs, но может выполнить лучше, когда несколько выбросов маскируют друг друга.
Moving medianВыбросы заданы как элементы больше, чем заданный порог локального масштабированного MAD от локальной медианы по заданному окну. Порогом по умолчанию является 3.
Moving meanВыбросы заданы как элементы больше, чем заданный порог локальных стандартных отклонений от локального среднего значения по заданному окну. Порогом по умолчанию является 3.
PercentilesВыбросы заданы как элементы за пределами диапазона процентили, указанного верхним и более низким порогом. Более низким порогом процентили по умолчанию является 10 и верхним порогом процентили по умолчанию является 90. Допустимые пороговые значения находятся в интервале [0,100].

Задайте тип окна и размер, когда методом для обнаружения выбросов будет Moving median или Moving mean.

ОкноОписание
CenteredЗаданная длина окна сосредоточена о текущей точке.
AsymmetricЗаданное окно, содержащее число элементов перед текущей точкой и числом элементов после текущей точки.

Размеры окна относительно модулей переменной X-axis.

Введенный в R2019b