Равные области в географической статистике

Распространенная ошибка в применении двумерной статистики к географическим данным заключается в игнорировании режима равной площади. Часто необходимо интервал данных для статистического анализа. В Декартовой плоскости это легко сделать, разделив пространство на равные квадраты x-y. Географический эквивалент этого состоит в том, чтобы объединить данные в равных квадратах широты и долготы. Поскольку такие квадраты в высоких широтах покрывают меньшие площади, чем их низкоширотные аналоги, наблюдения в этих областях являются недооцененными. Результатом могут быть выводы, которые смещены к экватору.

Географические гистограммы

Географическая функция гистограммы histr позволяет отображать привязанные географические наблюдения. histr функция приводит к равноправному раскладыванию. Каждый интервал имеет одно и то же угловое измерение как в широте, так и в долготе, с измерением по умолчанию 1 степень. Возвращаются центральные широты и долготы интервалов, а также количество наблюдений за интервалом:

[binlat,binlon,num] = histr(lats,lons)

Как отмечалось выше, эти равноправные интервалы приводят к подсчету смещения по направлению к экватору. Вот отображение одной степени - на одну степень раскладывания приблизительно 5000 случайных точек данных в России. Относительный размер кругов указывает количество наблюдений за интервалом:

Это фрагмент всей карты, отображенная в проекции Бонна равной площади. Первым шагом в создании отображения данных без смещения площади является выбор проекции равной площади. Символы пропорционального размера являются результатом специализированной функции отображения scatterm.

Можно исключить смещение области путем добавления четвертого выходного аргумента к histr, который будет использоваться для взвешивания наблюдения каждого интервала с помощью области этого интервала:

[binlat,binlon,num,wnum] = histr(lats,lons)

Четвертый выход является взвешенным количеством наблюдений. Количество наблюдений каждого интервала делится на нормированную область. Поэтому высокоширотный интервал будет иметь большее взвешенное число, чем низкоширотный интервал с таким же количеством фактических наблюдений. Те же данные и интервалы сильно отличаются, когда они взвешены по площади:

Заметьте, что на этом отображении есть большие символы на севере. Предыдущее отображение предположило, что данные были относительно равномерно распределены. Когда факторы равной площади включены, ясно, что данные смещены к северу. На самом деле, данные используются в северном направлении, но простая равноправная обработка не смогла продемонстрировать это.

histr поэтому функция обеспечивает отображение данных взвешенной по площади. Однако фактические используемые интервалы имеют различные области. Помните, что одна степень - на одну степень интервала около полюса, намного меньше, чем его аналог около экватора.

hista функция обеспечивает фактические интервалы равной площади.

Преобразование в систему координат с равной площадью

Сами фактические данные могут быть преобразованы в систему координат с равной площадью для анализа с другими статистическими функциями. Легко преобразовать набор точек географической широты-долготы в равную по площади x-y Декартову систему координат. grn2eqa функция применяет то же преобразование, что и при вычислении цилиндрической проекции равной площади:

[x,y] = grn2eqa(lat,lon)

Для каждого географического lat - lon пара, равная по площади x - y возвращается. Переменные x и y можно затем эксплуатировать в предположении равной площади, используя различные двумерные статистические методы. Инструменты для такого анализа можно найти в программном обеспечении Statistics and Machine Learning Toolbox™ и в других местах. Результаты могут затем быть преобразованы назад в географические координаты с помощью eqa2grn функция:

[lat,lon] = eqa2grn(x, y)

Помните, что при преобразовании назад и вперед между системами широта соответствует y, а долгота соответствует x.

Похожие темы

Для просмотра документации необходимо авторизоваться на сайте