exponenta event banner

Анализ Простростей

Сравнение Landmark данных

procrustes функция анализирует распределение набора форм с помощью анализа Procrustes. Этот метод анализа совпадает с историческими данными (геометрические местоположения, представляющие значимые функции в заданной форме), чтобы вычислить лучшие сохраняющие форму евклидовы преобразования. Эти преобразования минимизируют различия в местоположении между сравненными историческими данными.

Анализ Procrustes также полезен в сочетании с многомерным масштабированием. В конструкции карты с использованием многомерного масштабирования существует наблюдение, что ориентация восстановленных точек является произвольной. Два различных применения многомерного масштабирования могут привести к восстановленным точкам, которые очень похожи в принципе, но выглядят по-разному, потому что они имеют различные ориентации. The procrustes функция преобразует один набор точек, чтобы сделать их более сопоставимыми с другим.

Вход данных

procrustes функция принимает за вход две матрицы:

  • Матрица целевой формы X имеет размерность n × p, где n количество ориентиров в форме и p количество измерений на один ориентир.

  • Матрица формы сравнения Y имеет размерность n × q с qp. Если на один ориентир для формы сравнения приходится меньше измерений, чем на целевую форму (q <p), функция добавляет столбцы нулей к Y, получая n × p матрица.

Уравнение для получения преобразованной формы, Z, является

Z=bYT+c(1)

где:

  • b является масштабным коэффициентом, который растягивает (b > 1) или сжимает (b < 1) точки.

  • T - ортогональная матрица поворота и отражения.

  • c является матрицей с постоянными значениями в каждом столбце, используемой для сдвига точек.

The procrustes функция выбирает b, T, и c, чтобы минимизировать расстояние между целевой формой X и преобразованной формой Z, как измеряется критерием наименьших квадратов:

i=1nj=1p(XijZij)2

Предварительная обработка данных для точных результатов

Анализ Procrustes подходит, когда все p размерности измерений имеют сходные шкалы. Анализ был бы неточным, например, если бы столбцы Z имели различные шкалы:

  • Первый столбец измеряют в миллилитрах в диапазоне от 2000 до 6000.

  • Второй столбец измеряется в степенях Цельсия от 10 до 25.

  • Третий столбец измеряется в килограммах в диапазоне от 50 до 230.

В таких случаях стандартизируйте свои переменные:

  1. Вычитание среднего значения выборки из каждой переменной.

  2. Разделение каждой результирующей переменной на стандартное отклонение выборки.

Используйте zscore функция для выполнения этой стандартизации.

См. также

Похожие темы