При работе с растрами с разным разрешением следует пересчитывать изображение на самое высокое или самое низкое разрешение?

16

Я ищу рекомендации по передовым методам работы с слоями растровых данных с различными разрешениями и проекциями. Совет, который мне дали, - всегда повторять выборку слоя с наименьшим разрешением перед выполнением любого анализа, но мне это кажется огромной тратой точности, и мне никогда не давали четкого объяснения, почему это нужно делать.

Когда целесообразно выполнить повторную выборку, чтобы соответствовать сетке с более высоким разрешением, и каковы последствия по сравнению с повторной выборкой с более низким разрешением?

Я понимаю, что это, вероятно, сильно зависит от ситуации. Я в основном ищу общие рекомендации, но вот мой конкретный сценарий для справки:

Сценарий: я собираюсь построить модель пространственной регрессии, прогнозирующую использование земли, основанную на различных экологических и социально-экономических слоях. Моя карта землепользования получена от Landsat и, следовательно, имеет разрешение 30 м. Примеры пояснительных слоев включают DEM SRTM (3 угловых секунды, ~ 90 м) и климатические слои Bioclim (30 угловых секунд, ~ 1 км).

Мэтт СМ
источник
1
Не могли бы вы предоставить больше информации о регрессионной модели и методе реализации? +1 за хорошо построенный, интересный вопрос!
Аарон
Я сравниваю лесной покров в два момента времени и использую модель логистической регрессии с (двоичной) вероятностью вырубки леса в качестве моего ответа. Я реализую это в R.
Matt SM

Ответы:

17

На самом деле все зависит не от ситуации, а от статистической ошибки.

Каждый раз, когда вы повторно выбираете изображение с более высоким разрешением, вы вводите ложную точность. Рассмотрим набор данных, измеренный в футах только для целых чисел. Любая данная точка может быть на расстоянии +/- 0,5 фута от ее фактического местоположения. Если вы сделаете выборку с точностью до десятой доли, вы теперь скажете, что любое данное число не более +/- 0,1 от его фактического местоположения. Тем не менее, вы знаете, что ваши исходные измерения были не такими точными, и теперь вы работаете в пределах погрешности. Однако, если вы пойдете другим путем и выполните повторную выборку с более низким разрешением, вы знаете, что любое заданное значение точки определенно является точным, поскольку оно содержится в пределах погрешности большей выборки.

Помимо статистической математики, первое, что приходит на ум, - это геодезия. В более старых исследованиях указывались только подшипники с точностью до полминуты и расстояния до десятой доли фута. Построение пересечения границы с этими измерениями часто может привести к неправильному замыканию (начальная точка и конечная точка должны быть одинаковыми, но не должны) измеряться в футах. Современные обзоры идут по крайней мере с точностью до секунды и сотни футов. Производные значения (например, площадь участка) могут существенно зависеть от разницы в точности. Само производное значение также может быть дано как слишком точное.

В вашем случае анализа, если вы выполните выборку с более высоким разрешением, ваши результаты будут иметь гораздо большую точность, чем данные, на которых они основаны. Рассмотрим ваш SRTM на 90м. Каким бы методом они не измеряли высоту (среднее / максимальное / среднее значение), наименьшая единица (пиксель), которую можно отличить от соседей, составляет 90 метров. Если вы пересчитаете это до 30 м, либо:

  • Вы предполагаете, что все девять из полученных пикселей имеют ту же высоту, когда на самом деле может быть только один - центр или верхний левый - (или ни один!)
  • Вы интерполируете между пикселями, создавая производные значения, которых раньше не было

Таким образом, в обоих случаях вы вводите ложную точность, потому что ваши новые подвыборки фактически не измерялись.

Смежный вопрос: Какие методы доступны для моделирования пригодности земли?

Крис У
источник
Это, безусловно, верно для точечных данных. Но мне интересно, отличается ли это для растровых данных, которые усредняют непрерывно изменяющуюся пространственную величину, где есть точность местоположения и точность измеренной величины. Кроме того, разные величины имеют разные уровни пространственного изменения. Например, повторная выборка данных высот с более высоким разрешением должна вносить больше ошибок в горных районах, чем в прериях.
Мэтт С.М.
@MattSM Это верно для всех пространственных данных и усугубляется статистической ошибкой измеренной величины. Рассмотрим ваш SRTM на 90м. Каким бы методом они не измеряли высоту (среднее / максимальное / среднее значение), наименьшая единица (пиксель), которую можно отличить от соседей, составляет 90 метров. Если вы повторно выберете это значение до 30 м, вы теперь скажете, что все 9 из полученных пикселей имеют ту же высоту, когда на самом деле может быть только один (или ни один!) - центр или верхний левый угол. Или вы интерполируете между пикселями, создавая значения, которых раньше не было, что дает ложную точность. И да, диапазон значений играет на потенциальную ошибку.
Крис W
В качестве дополнительного примечания можно интерполировать определенные особенности в особых случаях, когда шаблон явно ограничен - одна негеографическая особенность, которая приходит на ум, - это восстановление информации номерного знака из фотографий с слишком низким разрешением для чтения. Но вы должны знать, на что вы смотрите. Я помню некоторые случаи, когда реконструкция номерного знака не удалась, потому что рассматриваемая табличка была написана неевропейским шрифтом, таким как арабский.
Стив Барнс
Как насчет растров с разрешением на основе дуг, разве у них нет ячеек сетки, которые могут иметь разные области / пропорции в разных областях?
CMCDragonkai
@CMCDragonkai Я не уверен, как решить эту проблему, потому что вы получаете представление данных в сравнении с форматом и системами координат / проекциями. Да, географическая область в растре не обязательно является такой же однородной, как квадратные (или другие пропорции) пиксели. Об этом вам расскажут многие спецификации спутниковых данных (пиксель - это x на надире и y на краю полосы). Но проблемы повторной выборки все еще применяются - если что-нибудь это только усугубляет проблему. (И извините за задержку, я не был на SE в течение некоторого времени.)
Крис W