procrustes
функция анализирует распределение набора форм с помощью анализа Procrustes. Этот метод анализа совпадает с историческими данными (геометрические местоположения, представляющие значимые функции в заданной форме), чтобы вычислить лучшие сохраняющие форму евклидовы преобразования. Эти преобразования минимизируют различия в местоположении между сравненными историческими данными.
Анализ Procrustes также полезен в сочетании с многомерным масштабированием. В конструкции карты с использованием многомерного масштабирования существует наблюдение, что ориентация восстановленных точек является произвольной. Два различных применения многомерного масштабирования могут привести к восстановленным точкам, которые очень похожи в принципе, но выглядят по-разному, потому что они имеют различные ориентации. The procrustes
функция преобразует один набор точек, чтобы сделать их более сопоставимыми с другим.
procrustes
функция принимает за вход две матрицы:
Матрица целевой формы X имеет размерность n
× p
, где n
количество ориентиров в форме и p
количество измерений на один ориентир.
Матрица формы сравнения Y имеет размерность n
× q
с q
≤ p
. Если на один ориентир для формы сравнения приходится меньше измерений, чем на целевую форму (q
<p
), функция добавляет столбцы нулей к Y, получая n
× p
матрица.
Уравнение для получения преобразованной формы, Z, является
(1) |
где:
b является масштабным коэффициентом, который растягивает (b > 1) или сжимает (b < 1) точки.
T - ортогональная матрица поворота и отражения.
c является матрицей с постоянными значениями в каждом столбце, используемой для сдвига точек.
The procrustes
функция выбирает b, T, и c, чтобы минимизировать расстояние между целевой формой X и преобразованной формой Z, как измеряется критерием наименьших квадратов:
Анализ Procrustes подходит, когда все p
размерности измерений имеют сходные шкалы. Анализ был бы неточным, например, если бы столбцы Z имели различные шкалы:
Первый столбец измеряют в миллилитрах в диапазоне от 2000 до 6000.
Второй столбец измеряется в степенях Цельсия от 10 до 25.
Третий столбец измеряется в килограммах в диапазоне от 50 до 230.
В таких случаях стандартизируйте свои переменные:
Вычитание среднего значения выборки из каждой переменной.
Разделение каждой результирующей переменной на стандартное отклонение выборки.
Используйте zscore
функция для выполнения этой стандартизации.