Способы работы с функцией долготы / широты [закрыто]

19

Я работаю над вымышленным набором данных с 25 функциями. Двумя характеристиками являются широта и долгота места, а другие - значения pH, высота, скорость ветра и т. Д. С различными диапазонами. Я могу выполнить нормализацию для других функций, но как мне приблизиться к функциям широты / долготы?

Изменить: Это проблема для прогнозирования урожайности в сельском хозяйстве. Я думаю, что широта / долгота очень важны, поскольку места могут быть жизненно важны для прогнозирования и, следовательно, дилеммы.

AllThingsScience
источник
Не могли бы вы уточнить, почему вы не думаете, что можете нормализовать эти функции? Предположительно они числовые так же, как и другие функции, так что вы можете взять среднее / SD? Вы беспокоитесь о естественном измерении расстояния между локациями? Если да, охватывают ли данные небольшую область (с аналогичными значениями) или это глобально?
Нил Слэйтер
@NeilSlater Просто мне интуитивно не имеет смысла нормализовать эти функции. Информация не будет потеряна, если нормализуется? У меня есть набор данных, охватывающий округа Америки.
AllThingsScience
Как вы думаете, какая информация будет потеряна? Вероятно, это не будет на самом деле потеряно, но если вы объясните в своем вопросе, что вас беспокоит, кто-то сможет ответить. Не зная больше, я бы просто нормализовал независимо - для полностью глобальных значений и некоторых проблем (где важно расстояние между точками) я мог бы создать функцию трехмерных декартовых координат из long / lat.
Нил Слэйтер
Какой у тебя вопрос здесь? Что вы пытаетесь выяснить по данным? Корреляция? Кластеризация? Классификация? Прогноз? Интерполяция? Как местоположение важно для вашей модели?
Spacedman
@Spacedman Пожалуйста, смотрите редактирование.
AllThingsScience

Ответы:

24

У длинных координат есть проблема в том, что они представляют собой 2 объекта, которые представляют трехмерное пространство. Это означает, что длинная координата вращается вокруг, что означает, что два самых крайних значения на самом деле очень близко друг к другу. Я сталкивался с этой проблемой несколько раз, и в этом случае я сопоставляю их с координатами x, y и z. Это означает, что близкие точки в этих трех измерениях также близки в реальности. В зависимости от варианта использования вы можете игнорировать изменения высоты и отображать их в идеальную сферу. Эти функции могут быть стандартизированы должным образом.

Чтобы уточнить (обобщено из комментариев):

x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon), 
z = sin(lat) 
Ян ван дер Вегт
источник
1
Это очень интересно. Спасибо! Не могли бы вы подтвердить, что это формулы для конвертации? x = R * cos (lat) * cos (lon), y = R * cos (lat) * sin (lon), z = R * sin (lat)
AllThingsScience
У меня нет доступа к моему коду в данный момент, но он выглядит правильно. Вам не нужен R, так как вы все равно будете стандартизироваться;)
Ян ван дер Вегт
Отлично! Спасибо.
AllThingsScience