Я работаю над вымышленным набором данных с 25 функциями. Двумя характеристиками являются широта и долгота места, а другие - значения pH, высота, скорость ветра и т. Д. С различными диапазонами. Я могу выполнить нормализацию для других функций, но как мне приблизиться к функциям широты / долготы?
Изменить: Это проблема для прогнозирования урожайности в сельском хозяйстве. Я думаю, что широта / долгота очень важны, поскольку места могут быть жизненно важны для прогнозирования и, следовательно, дилеммы.
machine-learning
python
feature-engineering
feature-scaling
normalization
AllThingsScience
источник
источник
Ответы:
У длинных координат есть проблема в том, что они представляют собой 2 объекта, которые представляют трехмерное пространство. Это означает, что длинная координата вращается вокруг, что означает, что два самых крайних значения на самом деле очень близко друг к другу. Я сталкивался с этой проблемой несколько раз, и в этом случае я сопоставляю их с координатами x, y и z. Это означает, что близкие точки в этих трех измерениях также близки в реальности. В зависимости от варианта использования вы можете игнорировать изменения высоты и отображать их в идеальную сферу. Эти функции могут быть стандартизированы должным образом.
Чтобы уточнить (обобщено из комментариев):
источник