Некоторые функции Mapping Toolbox™ вычисляют основные географические измерения для пространственного анализа и для фильтрации и кондиционирования данных. Начиная с MATLAB® функции могут вычислять статистику, такую как средства, медианы и отклонения, почему бы не использовать эти функции в тулбоксе? Прежде всего, классические статистические формулы обычно предполагают, что данные одномерны (и, часто, нормально распределены). Поскольку это не верно для геопространственных данных, пространственные аналитики разработали статистические показатели, которые расширяют традиционную статистику до более высоких размерностей.
Во-вторых, такие формулы обычно предполагают, что данные занимают двумерную Декартову систему координат. Вычисление статистики для геопространственных данных с географическими координатами как в Декартовой среде может дать статистически неуместные результаты. Хотя это предположение может иногда давать разумные числовые приближения в малых географических областях, для больших районов это может привести к неправильным выводам из-за измерений расстояния и допущений площади, которые неуместны для сфер и сфероидов. Mapping Toolbox выполняет соответствующие вычисления статистики для геопространственных данных, избегая этих потенциальных подводных камней.
Рассмотрим задачу вычисления среднего положения набора географических точек. Взятие среднеарифметического значения широт и долгот с помощью стандартного MATLAB mean
функция может показаться разумной, но это может привести к вводящим в заблуждение результатам.
Взять две точки на одной широте, 180 ° друг от друга по долготе, для примера (30 ° N, 90 ° W) и (30 ° N, 90 ° E). Средняя широта (30 + 30 )/2 = 30, что кажется правильным. Точно так же средняя долгота должна быть (90 + (-90) )/2 = 0. Однако, как можно также выразить 90 ° W как 270 ° E, (90 + 270 )/2 = 180 также является действительной средней долготы. Таким образом, существует два правильных ответа, основной меридиан и dateline. Это демонстрирует, как сферичность Земли вносит тонкости в пространственную статистику.
Эта проблема дополнительно сложна, когда некоторые точки находятся в разных широтах. Поскольку степень долготы в Полярном круге занимает гораздо меньшее расстояние, чем градус в экваторе, расстояние между точками, имеющими заданное различие долготы, изменяется в зависимости от широты.
На самом ли деле 30 ° N является правильной средней широтой в первом примере? Среднее положение двух точек должно быть равноудаленным от этих двух точек, а также должно минимизировать общее расстояние. Удовлетворяет ли (30 ° N, 0 °) этим критериям?
dist1 = distance(30,90,30,0) dist1 = 75.5225 dist2 = distance(30,-90,30,0) dist2 = 75.5225
Рассмотрим третью точку, (lat
, lon
), что также равноудалено от вышеуказанных двух точек, но на меньшем расстоянии:
dist1 = distance(30,90,lat,lon) dist1 = 60.0000 dist2 = distance(30,-90,lat,lon) dist2 = 60.0000
Что это за загадочная точка? The lat
90 ° N и любой lon
сделаю. Северный полюс является истинным географическим средним из этих двух точек. Обратите внимание, что большая окружность, содержащая обе точки, проходит через Северный полюс (большая окружность представляет кратчайший путь между двумя точками на сфере).
Функция Mapping Toolbox meanm
определяет среднее географическое значение любого числа точек. Это делается с помощью трехмерного векторного сложения всех точек. Для примера попробуйте следующее:
lats = [30 30]; longs = [-90 90]; [latbar,longbar] = meanm(lats,longs) latbar = 90 longbar = 0
Это ответ, который вы теперь ожидаете. Это географическое значение может привести к одной странности; если все векторы отменяют друг друга, среднее значение является центром планеты. В этом случае возвращенная средняя точка является (NaN,NaN
) и отобразится предупреждение. Это явление очень невероятно в реальных данных, но может быть легко построено. Для примера это происходит, когда все точки равномерно расположены вдоль большого круга. Попробуйте взять среднее географическое (0 °, 0 °), (0 °, 120 °) и (0 °, 240 °), которые трисектируют экватор.
elats = [0 0 0]; elons = [60 120 240]; meanm(elats, elons) ans = 0 120.0000
Как вы можете ожидать, Декартово определение стандартного отклонения, представленное в стандартной функции MATLAB std
является также неуместным для географических данных, которые являются нераскрытыми или охватывают значительный фрагмент планеты. В зависимости от вашего предназначения, вы можете использовать отдельные географические отклонения для широты и долготы, обеспечиваемые функцией stdm
или одно стандартное расстояние, предусмотренное в stdist
. Оба метода измеряют отклонение точек от среднего положения, вычисленного meanm
.
stdm
stdm
функция обрабатывает отклонения широты и долготы отдельно.
[latstd,lonstd] = stdm(lat,lon)
Функция возвращает два отклонения, одно для широт и одно для долгот.
Отклонение широты является прямолинейным стандартным вычислением отклонения от средней широты (средней параллели), возвращаемой meanm
. Это разумная мера для большинства случаев, так как на сфере, по крайней мере, степень широты всегда имеет одну и ту же длину дуги.
Отклонение долготы - другое дело. Простые вычисления, основанные на угловом отклонении суммы квадратов от средней долготы (средний меридиан), вводят в заблуждение. Длина дуги, представленная степенью долготы в крайних широтах, значительно меньше, чем у низких широт.
Термин «уход» используется, чтобы представлять расстояние длины дуги вдоль параллели точки от данного меридиана. Например, принимая сферическую планету, уклон степени долготы у Экватора является степенью длины дуги, но уклон степени долготы на широте 60 ° составляет половину степени длины дуги. stdm
функция вычисляет отклонение суммы квадратов от среднего меридиана.
Если вы хотите построить график линий с одной сигмой для stdm
, линии сигмы широты параллельны. Однако линии сигмы долготы не являются меридианами; они являются линиями постоянного отхода от средней параллели.
Эта обработка отклонений имеет свои проблемы. Для примера его зависимость от логики системы координат может заставить его разрушиться около полюсов. По этой причине стандартное расстояние, обеспечиваемое stdist
часто является лучшим показателем отклонения. The stdm
обработка полезна для многих приложений, особенно когда данные не являются глобальными. Например, эти потенциальные трудности не будут представлять опасности для точек данных, приуроченных к стране Мексики.
stdist
Стандартное расстояние географических данных является мерой рассеяния данных по их расстоянию от среднего географического значения. Среди его преимуществ - применимость в любой точке земного шара и его единое значение:
dist = stdist(lat,lon)
Короче говоря, стандартное расстояние является средней, нормой или кубической нормой расстояний точек данных в смысле большого круга от среднего положения. Вероятно, это высшая мера по сравнению с двумя отклонениями, возвращенными stdm
за исключением случаев, когда особо широтно - или долготно-зависимая функция находится на рассмотрении.