Для обеспечения точного, эффективного или содержательного анализа данных могут потребоваться методы предварительной обработки. Очистка данных относится к методам поиска, удаления и замены неверных или отсутствующих данных. Выявление локальных экстремальных и резких изменений может помочь выявить значительные тенденции данных. Сглаживание и сдерживание - это процессы удаления шумов и полиномиальных трендов из данных, в то время как масштабирование изменяет границы данных. Методы группирования и связывания определяют признаки данных по группам.
| Очистить отсутствующие данные | Поиск, заполнение или удаление отсутствующих данных в интерактивном редакторе |
| Очистить данные об отклонениях | Поиск, заполнение или удаление отклонений в редакторе Live Editor |
| Найти точки изменения | Поиск резких изменений в данных в интерактивном редакторе |
| Найти местные экстремумы | Поиск локальных максимумов и минимумов в интерактивном редакторе |
| Сглаживание данных | Сглаживание шумных данных в редакторе Live Editor |
| Удалить тенденции | Удаление полиномиального тренда из данных в редакторе Live Editor |
Очистить грязные и отсутствующие данные в таблицах
В этом примере показано, как находить, очищать и удалять строки таблицы с отсутствующими данными.
Удаление линейных трендов из данных.
Группирование переменных для разделения данных
Переменные группировки можно использовать для классификации переменных данных.
Разделение данных на группы и расчет статистики
В этом примере показано, как группировать данные и применять функции статистики к каждой группе.
Разбить переменные данных таблицы и применить функции
В этом примере показано, как группировать переменные данных и применять функции к каждой группе.