Доступно ли объяснение ошибки среднеквадратичного значения (RMSE) для чайников?

14

Наличие всестороннего опыта в ГИС иногда недостаточно для полного понимания некоторых понятий ГИС Наука. Чтобы добавить к этому, я тоже не математик.

Учитывая это, сможет ли кто-нибудь предложить ребенку объяснение среднеквадратичной ошибки (RMSE), когда геопривязать изображение к базовой карте? Проделав эту операцию тысячу раз, моя единственная задача - сначала найти местоположения на целевой карте, которые также находятся на базовой карте. Используя здравый смысл в качестве инструмента, я обычно нахожу церкви, старые здания и подобные объекты, которые являются очень стабильными структурами и не изменились бы во временной разнице между базовой картой и целевым изображением. После размещения максимально возможного количества паролей, я бы посмотрел таблицу статистики и либо заново сделал бы пароли с высоким среднеквадратичным средним значением, либо удалил их, чтобы общий балл среднеквадратичного значения стал как можно ниже.

Теперь я знаю, что rmse - это статистический расчет ошибок, но что меня всегда беспокоило, так это то, что иногда я на 100% уверен, что точки очень точно размещены на изображениях ... например. на шпиле церкви или другой стабильной структуре, которая присутствует как на целевом изображении, так и на базовой карте, но значение rmse все еще велико. Следовательно, я мог бы изменить точки прохода на местоположение, которое находится дальше от эталонной структуры (т.е. сделать визуальное преобразование менее точным), чтобы уменьшить значение rmse! Это кажется мне парадоксом, потому что я бы уменьшал визуальную точность операции, чтобы повысить статистическую точность.

Иногда я полностью игнорирую rmse, потому что могу ВИДЕТЬ, что после операции геопривязки эталонная карта и целевое изображение выстраиваются очень хорошо ... т.е. все точки прохода находятся в абсолютно правильном месте на обеих картах.

Может ли кто-нибудь предложить мне более простое объяснение того, делаю ли я здесь что-то в корне неправильно?

Роберт Бакли
источник
3
Полу соответствующий комментарий. Никогда не используйте такие вещи, как высокие здания, церковные скобы и башни. Попробуйте использовать точки около уровня земли
Devdatta Tengshe
1
Более низкое среднеквадратическое отклонение не всегда означает лучшую привязку Экстремальным примером является, естественно, сплайн-преобразование, которое снизит среднеквадратичное отклонение до 0, не говоря уже о том, насколько точны или нет ваши баллы.
HDunn
2
Просто чтобы подчеркнуть то, что сказал Девдатта: если вы не привязываете карту к карте, которая использует точно такие же аэрофотоснимки, пиксель за пикселем, как карту, на которую вы ссылаетесь, вы не должны использовать церковный шпиль для географической привязки чего-либо, если у вас есть другие варианты , Контрольные точки должны быть как можно ближе к земле. Если ваш церковный шпиль был сфотографирован с двух разных углов с разных высот, фактическое местоположение, на которое вы щелкаете, может быть совсем немного изменено.
Дан С
Эта публикация действительно помогла этой "Пустышке" визуализировать RMSE: /gis/4802/rmse-between-two-rasters-step-by-step
Стю Смит

Ответы:

11

Есть несколько проблем под рукой, и я думаю, что мы должны решать их один за другим.

Я чувствую, что вы пытаетесь спросить

Как установить географическую привязку карты, чтобы иметь наименьшую среднеквадратичную ошибку?

Если это так, я бы посоветовал вам отредактировать свой вопрос и соответственно изменить название.

Чтобы понять, как уменьшить ошибку RMS, необходимо понять, что означает ошибка RMS. Предположим, есть nточки; Для каждой точки у вас есть введенные вами координаты, и у вас есть рассчитанные координаты. Разница между ними рассчитывается с использованием простой евклидовой геометрии, и это называется ошибкой.

Чтобы получить общую ошибку, мы складываем эти ошибки. мы не берем простое среднее арифметическое, а используем среднеквадратичное значение этих ошибок. Для этого есть много научных причин, но мои статистические знания слишком слабы, чтобы объяснить это вам.

Таким образом, вы вычисляете среднеквадратическую ошибку, используя следующую формулу: RMS error=Square Root(Σ(e^2)/n)

Теперь перейдем к вопросу, который вы действительно задаете. Как мы можем уменьшить эту ошибку RMS? Для этого нужно обратить внимание на то, как на самом деле рассчитываются рассчитанные координаты. Здесь есть два основных момента:

Во-первых, вам нужно выбрать правильное преобразование для географической привязки. Есть несколько преобразований (аффинный / сплайн, 1-й порядок, 2-й порядок и т. Д.). Я могу лучше всего процитировать whuber, который в этом превосходном ответе говорит:

Используйте метод, который может представлять искажения, которые могли произойти. При сканировании на бумажной карте искажения могут быть локальными и нерегулярными, поэтому рассмотрим сплайны. С изменениями проекции (включая те, которые происходят при обработке большинства аэрофотоснимков и спутниковых изображений) правильное преобразование является проекционным. Проективные преобразования не являются ни полиномами (вообще), ни сплайнами.

Во-вторых, вам нужно соблюдать осторожность при выборе контрольных точек для вашей географической привязки. Whuber в своем ответе, связанном выше, делает несколько указателей в этом направлении.

Вам нужно выбрать точки, которые будут присутствовать на обоих изображениях. Такие вещи, как памятники, дорожные переходы, постоянные сооружения и т. Д. Обычно используются. Попробуйте использовать объекты на уровне земли или ближе к ней. Не используйте высокие здания, церковные шпили или башни, как вы упомянули в вопросе.

Причина проста. Большинство растров имеют вид под углом и обеспечивают наклонный вид. Следовательно, высокие объекты будут казаться наклоненными в направлении, направленном наружу от оси фокуса датчика. Например, посмотрите на следующее изображение Google Maps на Эйфелеву башню. Красная точка находится приблизительно там, где должен быть центр, но вы видите вершину башни в Голубой точке. (Это только иллюстративно. Вид со спутника на Google Map обрабатывается для удаления подобных артефактов, но многие все еще остаются)
введите описание изображения здесь

Девдатта Тенгше
источник
1
Я думаю, что вы имеете в виду среднеквадратическую ошибку = квадратный корень (Σ (e ^ 2) / n)
Llaves
Привет .... спасибо за все комментарии. Чтобы упростить мой вопрос до его основной формы, можно сказать следующее: «Зачем мне вообще нужно изучать RMSE, если я удовлетворен визуальным результатом изображения цели с географической привязкой? В конце дня, мы обычно будем смотреть на базовую карту и установить прозрачность целевого изображения на 50%. Если есть ошибка rmse от 2 до 9 для проходных точек, но изображение хорошо совпадает, кого это волнует ошибки?
Роберт Бакли
@RobertBuckley: Если это ваш вопрос, пожалуйста, посмотрите на gis.stackexchange.com/questions/8900/… . Нет конкретной ошибки RMS, к которой вам следует обратиться. Среднеквадратическая ошибка является лишь ориентировочной мерой, и вы можете ее игнорировать, если считаете, что результат достаточно хороший.
Девдатта Тенгше