Данные могут потребовать предварительной обработки методов для обеспечения точного, эффективный, или содержательного анализа. Очистка данных относится к методам поиска , удаление и замена плохих или отсутствующих данных. Обнаружение локальных экстремумов и резких изменений может помочь идентифицировать значительные тренды данных. Сглаживание и удаление тренда являются процессами для удаления шума и полиномиальных трендов из данных, в то время как масштабирование изменяет границы данных. Методы группировок и раскладывания идентифицируют характеристики данных по группам.
Clean Missing Data | Поиск, заполнение или удаление отсутствующих данных в Live Editor |
Clean Outlier Data | Поиск, заполнение или удаление выбросов в Live Editor |
Find Change Points | Найдите внезапные изменения данных в Live Editor |
Find Local Extrema | Найти локальные максимумы и минимумы в Live Editor |
Smooth Data | Сглаживайте зашумленные данные в Live Editor |
Remove Trends | Удалите полиномиальный тренд из данных в Live Editor |
Очистка грязных и пропущенных данных в таблицах
В этом примере показано, как найти, очистить и удалить строки таблицы с отсутствующими данными.
Удалите линейные тренды из данных.
Группировка переменных для разделения данных
Можно использовать сгруппированные переменные для классификации переменных данных.
Разделение данных на группы и вычисление статистики
В этом примере показано, как сгруппировать данные и применить функции статистики к каждой группе.
Разделение данных табличных переменных и применение функций
В этом примере показано, как сгруппировать переменные данных и применить функции к каждой группе.