exponenta event banner

Многомерное масштабирование

Одна из наиболее важных целей визуализации данных заключается в том, чтобы понять, насколько близки или далеки друг от друга точки. Часто это можно сделать с помощью разрозненного графика. Однако для некоторых анализов данные, которые вы можете иметь, могут быть не в форме точек вообще, а скорее в форме парных сходств или различий между случаями, наблюдениями или субъектами. Нет точек для построения графика.

Даже если ваши данные имеют форму точек, а не попарных расстояний, график рассеяния этих данных может оказаться бесполезным. Для некоторых видов данных соответствующим способом измерения того, насколько близки две точки, может быть не их евклидово расстояние. Хотя графики рассеяния необработанных данных упрощают сравнение евклидовых расстояний, они не всегда полезны при сравнении других типов межточечных расстояний, например расстояния городских блоков или даже более общих различий. Кроме того, при большом количестве переменных очень трудно визуализировать расстояния, если данные не могут быть представлены в небольшом количестве измерений. Как правило, необходимо какое-то уменьшение размеров.

Многомерное масштабирование (MDS) - это набор методов, которые решают все эти проблемы. MDS позволяет визуализировать, как близкие точки находятся друг к другу для многих видов метрик расстояния или разнородности, и может создавать представление данных в небольшом количестве измерений. MDS требует не необработанных данных, а только матрицы попарных расстояний или разнородностей.

См. также

|

Связанные темы