Моделирование цен на аренду - какой метод интерполяции использовать?

13

У меня есть национальный набор данных ~ 1,4 миллиона домохозяйств. Там у меня есть информация об аренде, размере (количество комнат и м2) и некоторые дополнительные характеристики каждого домохозяйства.

Я хотел бы использовать эти данные, чтобы создать поверхностную стоимость аренды для всей страны и использовать эту информацию в качестве прокси для оценки значений оставшихся ~ 1,5 миллиона домохозяйств, которые владеют или не имеют информации об аренде.

Пара вопросов здесь:

Подходит ли такой подход для решения такого рода проблем?

Какой метод интерполяции будет наиболее подходящим для использования здесь?

Кроме того, возможно ли принять во внимание информацию, например, о размере домашнего хозяйства?

Я использую ArcGIS 9.3 с лицензией ArcInfo.

Радек
источник
1
Похоже, что системы автоматизированной массовой оценки (CAMA) должны сделать что-то подобное. Интересно, как они справляются с этим. en.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Кирк Куйкендалл

Ответы:

10

Идея хороша, но предлагаемая реализация может быть слишком упрощенной, чтобы быть заслуживающей доверия. Арендная плата является собственностью экономических систем. Помимо влияния местоположения, они связаны с другими экономическими переменными в важных отношениях: состояние местной (и национальной) экономики, местные цены на жилье, доступность капитала, уровень занятости и т. Д. Для хорошей работы вам нужна эконометрическая модель , Может быть полезно иметь некоторые термины пространственного запаздывания , но прежде чем рассматривать такие осложнения, необходимо включить многие из этих экономических ковариат.

Сказав это, ваша способность к успеху зависит от отношений между данными, которые у вас есть, и арендной платой, которую вы хотите предсказать. Если ваши данные являются репрезентативной выборкой всей страны и географически разбросаны - представьте, что дома - это изюм на печенье, а у вас есть данные обо всех остальных изюмах в печенье - тогда может быть достаточно относительно простой модели. Если ваши данные географически сфокусированы - возможно, у вас есть информация об изюме с правой стороны печенья, и вы хотите сделать прогноз для изюма с левой стороны - тогда проблема является более сложной.

Хорошей отправной точкой было бы приспособление традиционной линейной эконометрической модели ренты к характеристикам домохозяйств и валовым пространственным характеристикам (таким как налоговая политика штата или округа), вычисление остатков и начало пространственного исследования остатков (с использованием вариографии , сглаживания пространственного ядра и т. д.) для захвата географических эффектов.

Подходят программное обеспечение доступно в качестве дополнения к R .

Whuber
источник
@whubber Ссылка на документ, описывающий вариографию, кажется мертвой. Есть ли шанс обновить его?
radek 14.12.12
1
Спасибо, @radek. Удивительно сложно найти в Интернете описание вариографии, которое является вводным, но точным, а не просто руководством по программному обеспечению. Я обнаружил недавнюю диссертацию на соискание ученой степени доктора философии, которая, судя по ее аннотации и введению, представляется четкой и тщательной и начинается с относительно элементарной точки зрения.
whuber
7

В качестве очень осторожного введения в темы пространственной регрессии я настоятельно рекомендую ознакомиться с рабочей книгой GeoDa (главы 22-25 будут наиболее интересны). Даже если вы не хотите использовать программное обеспечение, это очень полный обзор пространственной регрессии.

Будут ли встроенные регрессионные функции в ArcMap обрабатывать такое количество данных (неужели ни одному программному обеспечению будет трудно с таким количеством точек?)

Энди У
источник
3
(+1) 1,4 миллиона баллов - не проблема для регрессии. (Например, алгоритмы усилий по методу наименьших квадратов обычно пропорциональны кубу числа переменных. Для настройки уравнений требуется только одно быстрое сканирование набора данных.) Реальная проблема заключается в том, что 1,4 миллиона случаев будут иметь богатые и детальная структура: хороший анализ будет чрезвычайно трудоемким. (Я уверен, что этот набор данных может генерировать множество кандидатских диссертаций по экономике). Хитрость заключается в том, чтобы выполнять столько работы, сколько необходимо для получения достаточно точных и надежных ответов для поставленной задачи.
whuber
3

Я видел похожую работу, проделанную для цен на жилье с использованием гедонистического моделирования. См. Http://scholar.google.com/scholar?hl=ru&q=hedonic+price+geography для примеров.

Ян Тертон
источник
2
(+1) Я согласен, что литература по гедонистическим моделям цен на жилье в значительной степени применима к этому вопросу. Я воздерживался от предложения этого, хотя как человек, который не знаком с регрессией, может найти работу всех этих эконометристов пугающей (я знаю, я иногда делаю!), Мудрой теорией, хотя это была бы хорошая литература, чтобы проверить, особенно для ковариат представляет интерес.
Энди У