Функция procrustes
анализирует распределение набора использования форм анализ Procrustes. Этот метод анализа совпадает со знаменательными данными (геометрические местоположения, представляющие значительные функции в данной форме), чтобы вычислить лучшие сохраняющие форму Евклидовы преобразования. Эти преобразования минимизируют различия в местоположении между сравненными знаменательными данными.
Анализ Procrustes также полезен в сочетании с многомерным масштабированием. В Построении Карта Используя Многомерное Масштабирование там является наблюдением, что ориентация восстановленных точек произвольна. Два различных приложения многомерного масштабирования могли произвести восстановленные точки, которые очень похожи в принципе, но которые выглядят по-другому, потому что у них есть различные ориентации. Функция procrustes
преобразовывает один набор точек, чтобы сделать их более сопоставимыми с другим.
Функция procrustes
берет две матрицы в качестве входа:
Целевая матрица формы X имеет размерность n
× p
, где n
является количеством ориентиров в форме и p
, является количеством измерений на ориентир.
Матрица формы сравнения Y имеет размерность n
× q
с q
≤ p
. Если существует меньше измерений на ориентир для формы сравнения, чем целевая форма (q
<p
), функция добавляет столбцы нулей к Y, приводя к n
× матрица p
.
Уравнение, чтобы получить преобразованную форму, Z,
(1) |
где:
b является масштабным коэффициентом, который простирается (b> 1) или уменьшения (b <1) точки.
T является ортогональным вращением и отражательной матрицей.
c является матрицей с постоянными значениями в каждом столбце, используемом, чтобы переключить точки.
Функция procrustes
выбирает b, T и c, чтобы минимизировать расстояние между целевой формой X и преобразованной формой Z, как измерено критерием наименьших квадратов:
Анализ Procrustes является соответствующим, когда все размерности измерения p
имеют подобные шкалы. Анализ был бы неточен, например, если бы столбцы Z имели различные шкалы:
Первый столбец измеряется в миллилитрах в пределах от 2 000 - 6 000.
Второй столбец измеряется в градусах Цельсия в пределах от 10 - 25.
Третий столбец измеряется в килограммах в пределах от 50 - 230.
В таких случаях стандартизируйте свои переменные:
Вычитание демонстрационного среднего значения от каждой переменной.
Деление каждой результирующей переменной ее демонстрационным стандартным отклонением.
Используйте функцию zscore
, чтобы выполнить эту стандартизацию.