есть ли инструмент для очистки данных для python / pandas, похожий на инструмент R tidyr?

18

Я работаю над проблемой Kaggle, где некоторые переменные представлены строками, а не столбцами (разрушение сети Telstra). В настоящее время я ищу эквивалент функции collect (), separa (() и spread (), который можно найти в инструменте R tidyr.

cpumar
источник

Ответы:

3

R по gather()существу идет от широкой к длинной. Так,

  1. проверьте страницу панд о том, как использовать pandas.wide_to_long(),
  2. проверьте этот блог для обсуждения получения элегантной gatherфункции в Python.
ximiki
источник
0

Я попытался синтаксически имитировать пакет tidyr в python в пакете под названием tidypython. Я сделал его совместимым с пакетом dplython, который включает использование оператора >> для цепочек команд.

Он не был полностью протестирован, но должен работать довольно хорошо:

https://github.com/durrantmm/tidypython

Дайте мне знать, если это работает для вас.

Мэтт Даррант
источник