Общепринятая среднеквадратическая ошибка для выпрямления топографических карт
12
Это общий запрос по общепринятой практике / стандарту для определения приемлемых значений RMS при географической привязке топографических карт. Есть ли абсолютное значение?
Некоторые литературные источники предполагают, что оно должно быть «меньше или равно 1/2 стороны ячейки, которая составляет полное разрешение изображения».
Нет, для RMS нет абсолютного значения , поскольку оно зависит от качества карты с географической привязкой, качества целевой (базовой) карты и цели географической привязки. В частности, любой совет, который связывает RMS с размером ячейки, дезинформирован, поскольку размер ячейки отражает точность в цифровом представлении изображения, тогда как ошибка RMS отражает среднюю точность (при условии , что базовая карта является совершенно точной). Хотя различие в точности и точности может показаться бесцельным педантизмом, путать их с основной ошибкой с практическими последствиями.
Все это довольно расплывчато, поэтому давайте рассмотрим конкретный пример. Недавно я получил серию скриншотов карт, показывающих расположение образцов почвы. Чтобы получить координаты, я планировал привязать эти снимки экрана к базовой карте ортофото, а затем оцифровывать точки с помощью оцифровки с опережением. Среди соображений были:
Базовая карта ортофото имеет размер 0,3 м.
Скриншоты имеют размер около 2 м.
Места отбора проб почвы не были обследованы; они были расположены «на глаз» на карте, когда пробоотборник находился в поле. По оценкам клиента, точность составила около 3 м, но более вероятно 10 м.
На скриншотах есть несколько резких деталей: это в основном контурные линии со случайными линиями ограды (которые не четко видны на ортофото). Таким образом, установление множества хороших ссылок будет трудоемким и подверженным ошибкам.
Вероятно, на снимках экрана были некоторые локальные искажения, означающие, что высокая точность (низкая RMS) может быть достигнута только при сложных преобразованиях.
Было важно оцифровать местоположения образцов почвы, чтобы относительные расстояния были достаточно точными для близлежащих точек, но абсолютная точность не требовалась, потому что одним из результатов исследования будет получение гораздо большего количества образцов почвы, которые уточняют и делают более точной эту предварительную съемку.
Чтобы получить среднеквадратическое значение, равное половине большего размера ячейки, потребовалось бы полиномиальное преобразование высокого порядка или искривление в сетке точек, требующее создания сети из 50-100 хороших связей между изображениями: от одного до нескольких часов тщательной работы, большинство скорее всего, учитывая сложность даже поиска видимых ссылок. Чтобы получить среднеквадратичное значение, равное половине меньшего размера ячейки, потребовалось бы на порядок больше усилий: дни работы. Однако для целей исследования среднеквадратичное отклонение в 5 м будет более чем достаточным. Это было достигнуто с помощью 7 ссылок и аффинного преобразования, всего за несколько минут работы. Обратите внимание, что это RMS в несколько раз больше, чем большее из двух размеров ячеек на изображениях.
Этот пример показывает, как слепое следование плохим правилам может быть дорогостоящим . Сначала обратите внимание на ваши цели качества данных; все остальное вытекает из них.
Абсолютно. Там нет замены для предметно-ориентированных знаний и интуиции. Меня, программиста, не перестает удивлять, что то, что должно быть проблемой, идеально подходящей для современной ГИС, все еще остается неисчислимым искусством. Навыки действительно не изменились за последние 100 лет, когда какая-то яркая искра задумалась о прикреплении камеры к самолету. Это никоим образом не умаляет Мэннинга или его вопроса, но есть причина, по которой аэрофотосъемщики обеих мировых войн были так хорошо подготовлены, и почему эти навыки сегодня так актуальны, как и тогда.
MerseyViking
1
Отличный ответ! Я в значительной степени следую тому, что вы говорите, и конкретный пример, который вы привели, в значительной степени прибил его. @MerseyViking, я думаю, что вопрос очень актуален, так как многие коллеги попадают в ловушку этого правила.
пятницу,
очень хороший ответ, но я не согласен с тем, что RMSE отражает чистую точность. Он действительно включает в себя как дисперсию (точность) оценки, так и ее смещение (точность).
Radouxju
@radouxju Я согласен: спасибо за разъяснения.
whuber
4
Самая близкая книга, которую я должен вручить: Географические информационные системы в археологии, говорит, что это «зависит от масштаба карт и цели, для которой они ставятся», но рекомендует стремиться к ошибке менее 1: 3000, поэтому, если исходная карта была 1: 15000, тогда было бы приемлемо среднеквадратичное отклонение 5 м или менее. Конечно, все, что меньше 1/2 пикселя, будет в значительной степени избыточным, но было бы неплохо иметь его.
Если вы объединяете более одной карты, то окончательное среднеквадратичное среднеквадратичное отклонение будет являться квадратным корнем от суммы отдельных среднеквадратичных значений, поэтому, если одна карта с высоким разрешением не ведет себя, но с более низким разрешением, то это может быть Стоит потратить время на то, чтобы найти первый, который подойдет лучше.
+1 Хорошие очки. Обоснование 1: 3000 должно основываться на потребностях типичных археологических исследований. Это правило не будет переводиться в несвязанные поля.
whuber
3
На ваш вопрос есть ответ, который я всегда проходил.
меньше или равно 1/2 стороны ячейки, которая составляет общее разрешение изображения
Это эмпирическое правило. В реальной жизни иногда мне приходилось быть менее точным, чем это, по разным причинам:
Невозможно достичь этих уровней с количеством плиток, которые вы должны исправить.
Проект не требует точности, установленной этими правилами (т. Е. Их использование для стратегического проекта, и никакие измерения не будут производиться на основе результатов).
Было невозможно достичь этого из-за невозможности построить достаточное количество уверенных контрольных точек.
Самая близкая книга, которую я должен вручить: Географические информационные системы в археологии, говорит, что это «зависит от масштаба карт и цели, для которой они ставятся», но рекомендует стремиться к ошибке менее 1: 3000, поэтому, если исходная карта была 1: 15000, тогда было бы приемлемо среднеквадратичное отклонение 5 м или менее. Конечно, все, что меньше 1/2 пикселя, будет в значительной степени избыточным, но было бы неплохо иметь его.
Если вы объединяете более одной карты, то окончательное среднеквадратичное среднеквадратичное отклонение будет являться квадратным корнем от суммы отдельных среднеквадратичных значений, поэтому, если одна карта с высоким разрешением не ведет себя, но с более низким разрешением, то это может быть Стоит потратить время на то, чтобы найти первый, который подойдет лучше.
источник
На ваш вопрос есть ответ, который я всегда проходил.
Это эмпирическое правило. В реальной жизни иногда мне приходилось быть менее точным, чем это, по разным причинам:
источник