Вопросы с тегом «cross-section»

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

11
Почему использование данных поперечного сечения для вывода / прогнозирования продольных изменений - это плохо?

Я ищу бумагу, которая, я надеюсь, существует, но не знаю, есть ли она. Это может быть набор тематических исследований и / или аргумент из теории вероятностей о том, почему использование данных поперечного сечения для выведения / прогнозирования продольных изменений может быть плохой вещью (т.е. это...

9
Разрешено ли использовать средние значения для набора данных для улучшения корреляции?

У меня есть набор данных с зависимой и независимой переменной. Оба не временные ряды. У меня 120 наблюдений. Коэффициент корреляции составляет 0,43. После этого расчета я добавил столбец для обеих переменных со средним значением для каждых 12 наблюдений, в результате чего появилось 2 новых столбца...