exponenta event banner

Очистить данные об отклонениях

Поиск, заполнение или удаление отклонений в редакторе Live Editor

Описание

Задача Очистить данные об отклонениях позволяет интерактивно обрабатывать отклонения в данных. Задача автоматически генерирует код MATLAB ® для сценария в реальном времени.

С помощью этой задачи можно:

  • Поиск, заполнение или удаление отклонений из данных в переменной рабочей области.

  • Настройте методы поиска и заполнения отклонений.

  • Автоматическая визуализация данных об отклонениях и очищенных данных.

Clean Outlier Data task in Live Editor

Открыть задачу

Чтобы добавить задачу «Очистить данные об отклонениях» в живой сценарий в редакторе MATLAB, выполните следующие действия.

  • На вкладке «Интерактивный редактор» выберите «Задача» > «Очистить данные об отклонениях».

  • В блоке кода в сценарии введите соответствующее ключевое слово, например outlier или clean. Выберите пункт Очистить данные об отклонениях (Clean Outlier Data) в списке предлагаемых завершений команды.

Параметры

Эта задача работает с данными типа single или double содержится в векторе или таблице переменных. При предоставлении таблицы или расписания для входных данных укажите Все поддерживаемые переменные для очистки всех переменных с типом single или doubleили выберите, какой single или double для очистки переменных выберите Указанные переменные, а затем выберите переменные по отдельности.

Укажите метод заполнения отклонений с помощью одной из следующих опций.

Метод заполненияОписание
Linear interpolationЛинейная интерполяция соседних ненулевых значений.
Constant valueУказанное скалярное значение, которое равно 0 по умолчанию.
Center valueЗначение центра, определенное методом поиска.
Clip to threshold valueЗаполняет нижнее пороговое значение для элементов, меньших, чем нижнее пороговое значение, определенное методом поиска. Заполняется верхним пороговым значением для элементов, превышающим верхнее пороговое значение, определенное методом поиска.
Previous valueПредыдущее ненулевое значение.
Next valueСледующее ненулевое значение.
Nearest valueБлижайшее ненулевое значение.
Spline interpolationКусочно-кубическая интерполяция сплайна.
Shape-preserving cubic interpolation (PCHIP)Профильно-сохраняющая кусочно-кубическая интерполяция сплайна.
Modified Akima cubic interpolationМодифицированная Akima кубическая эрмитовая интерполяция.

Укажите метод обнаружения отклонений с помощью одной из следующих опций.

МетодОписание
Moving medianОтклонения определяются как элементы, превышающие заданный порог локального масштабированного MAD из локальной медианы над указанным окном. Пороговое значение по умолчанию: 3.
MedianОтклонения определяются как элементы, превышающие заданный порог масштабированных средних абсолютных отклонений (MAD) от медианы, что составляет 3 по умолчанию. Для входных данных A, масштабированный MAD определяется как c*median(abs(A-median(A))), где c=-1/(sqrt(2)*erfcinv(3/2)).
MeanОтклонения определяются как элементы, превышающие указанный порог стандартных отклонений от среднего значения, которое составляет 3 по умолчанию. Этот метод быстрее, но менее надежен, чем Median.
QuartilesОтклонения определяются как элементы, превышающие указанный порог межквартильных диапазонов выше верхнего квартиля (75 процентов) или ниже нижнего квартиля (25 процентов), что составляет 1.5 по умолчанию. Этот метод полезен, когда входные данные обычно не распределены.
GrubbsОтклонения выявляются с помощью теста Груббса, который удаляет одно отклонение на итерацию на основе проверки гипотез. Этот метод предполагает нормальное распределение входных данных.
Generalized extreme studentized deviate (GESD)Отклонения выявляются с использованием обобщенного экстремально изученного теста отклонения для отклонений. Этот итеративный метод аналогичен Grubbs, но может работать лучше, когда несколько отклонений маскируют друг друга.
Moving meanОтклонения определяются как элементы, превышающие заданный порог локальных стандартных отклонений от локального среднего значения по заданному окну. Пороговое значение по умолчанию: 3.
PercentilesОтклонения определяются как элементы, выходящие за пределы диапазона процентилей, определяемого верхним и нижним порогом. Пороговое значение нижнего процентиля по умолчанию: 10 и пороговое значение верхнего процентиля по умолчанию 90. Допустимые пороговые значения находятся в интервале [0,100].

Укажите тип и размер окна, если метод обнаружения отклонений Moving median или Moving mean.

ОкноОписание
CenteredУказанная длина окна центрирована относительно текущей точки.
AsymmetricУказанное окно, содержащее число элементов перед текущей точкой и число элементов после текущей точки.

Размеры окон зависят от переменных единиц по оси X.

Представлен в R2019b