У меня есть национальный набор данных ~ 1,4 миллиона домохозяйств. Там у меня есть информация об аренде, размере (количество комнат и м2) и некоторые дополнительные характеристики каждого домохозяйства.
Я хотел бы использовать эти данные, чтобы создать поверхностную стоимость аренды для всей страны и использовать эту информацию в качестве прокси для оценки значений оставшихся ~ 1,5 миллиона домохозяйств, которые владеют или не имеют информации об аренде.
Пара вопросов здесь:
Подходит ли такой подход для решения такого рода проблем?
Какой метод интерполяции будет наиболее подходящим для использования здесь?
Кроме того, возможно ли принять во внимание информацию, например, о размере домашнего хозяйства?
Я использую ArcGIS 9.3 с лицензией ArcInfo.
Ответы:
Идея хороша, но предлагаемая реализация может быть слишком упрощенной, чтобы быть заслуживающей доверия. Арендная плата является собственностью экономических систем. Помимо влияния местоположения, они связаны с другими экономическими переменными в важных отношениях: состояние местной (и национальной) экономики, местные цены на жилье, доступность капитала, уровень занятости и т. Д. Для хорошей работы вам нужна эконометрическая модель , Может быть полезно иметь некоторые термины пространственного запаздывания , но прежде чем рассматривать такие осложнения, необходимо включить многие из этих экономических ковариат.
Сказав это, ваша способность к успеху зависит от отношений между данными, которые у вас есть, и арендной платой, которую вы хотите предсказать. Если ваши данные являются репрезентативной выборкой всей страны и географически разбросаны - представьте, что дома - это изюм на печенье, а у вас есть данные обо всех остальных изюмах в печенье - тогда может быть достаточно относительно простой модели. Если ваши данные географически сфокусированы - возможно, у вас есть информация об изюме с правой стороны печенья, и вы хотите сделать прогноз для изюма с левой стороны - тогда проблема является более сложной.
Хорошей отправной точкой было бы приспособление традиционной линейной эконометрической модели ренты к характеристикам домохозяйств и валовым пространственным характеристикам (таким как налоговая политика штата или округа), вычисление остатков и начало пространственного исследования остатков (с использованием вариографии , сглаживания пространственного ядра и т. д.) для захвата географических эффектов.
Подходят программное обеспечение доступно в качестве дополнения к R .
источник
В качестве очень осторожного введения в темы пространственной регрессии я настоятельно рекомендую ознакомиться с рабочей книгой GeoDa (главы 22-25 будут наиболее интересны). Даже если вы не хотите использовать программное обеспечение, это очень полный обзор пространственной регрессии.
Будут ли встроенные регрессионные функции в ArcMap обрабатывать такое количество данных (неужели ни одному программному обеспечению будет трудно с таким количеством точек?)
источник
Я видел похожую работу, проделанную для цен на жилье с использованием гедонистического моделирования. См. Http://scholar.google.com/scholar?hl=ru&q=hedonic+price+geography для примеров.
источник