Я ищу рекомендации по передовым методам работы с слоями растровых данных с различными разрешениями и проекциями. Совет, который мне дали, - всегда повторять выборку слоя с наименьшим разрешением перед выполнением любого анализа, но мне это кажется огромной тратой точности, и мне никогда не давали четкого объяснения, почему это нужно делать.
Когда целесообразно выполнить повторную выборку, чтобы соответствовать сетке с более высоким разрешением, и каковы последствия по сравнению с повторной выборкой с более низким разрешением?
Я понимаю, что это, вероятно, сильно зависит от ситуации. Я в основном ищу общие рекомендации, но вот мой конкретный сценарий для справки:
Сценарий: я собираюсь построить модель пространственной регрессии, прогнозирующую использование земли, основанную на различных экологических и социально-экономических слоях. Моя карта землепользования получена от Landsat и, следовательно, имеет разрешение 30 м. Примеры пояснительных слоев включают DEM SRTM (3 угловых секунды, ~ 90 м) и климатические слои Bioclim (30 угловых секунд, ~ 1 км).
источник
Ответы:
На самом деле все зависит не от ситуации, а от статистической ошибки.
Каждый раз, когда вы повторно выбираете изображение с более высоким разрешением, вы вводите ложную точность. Рассмотрим набор данных, измеренный в футах только для целых чисел. Любая данная точка может быть на расстоянии +/- 0,5 фута от ее фактического местоположения. Если вы сделаете выборку с точностью до десятой доли, вы теперь скажете, что любое данное число не более +/- 0,1 от его фактического местоположения. Тем не менее, вы знаете, что ваши исходные измерения были не такими точными, и теперь вы работаете в пределах погрешности. Однако, если вы пойдете другим путем и выполните повторную выборку с более низким разрешением, вы знаете, что любое заданное значение точки определенно является точным, поскольку оно содержится в пределах погрешности большей выборки.
Помимо статистической математики, первое, что приходит на ум, - это геодезия. В более старых исследованиях указывались только подшипники с точностью до полминуты и расстояния до десятой доли фута. Построение пересечения границы с этими измерениями часто может привести к неправильному замыканию (начальная точка и конечная точка должны быть одинаковыми, но не должны) измеряться в футах. Современные обзоры идут по крайней мере с точностью до секунды и сотни футов. Производные значения (например, площадь участка) могут существенно зависеть от разницы в точности. Само производное значение также может быть дано как слишком точное.
В вашем случае анализа, если вы выполните выборку с более высоким разрешением, ваши результаты будут иметь гораздо большую точность, чем данные, на которых они основаны. Рассмотрим ваш SRTM на 90м. Каким бы методом они не измеряли высоту (среднее / максимальное / среднее значение), наименьшая единица (пиксель), которую можно отличить от соседей, составляет 90 метров. Если вы пересчитаете это до 30 м, либо:
Таким образом, в обоих случаях вы вводите ложную точность, потому что ваши новые подвыборки фактически не измерялись.
Смежный вопрос: Какие методы доступны для моделирования пригодности земли?
источник