Я использую pyspark (Python 2.7.9 / Spark 1.3.1) и имею объект GroupObject фрейма данных, который мне нужно фильтровать и сортировать в порядке убывания. Пытаюсь достичь этого с помощью этого фрагмента кода.
group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False)
Но это вызывает следующую ошибку.
sort() got an unexpected keyword argument 'ascending'
В pyspark 2.4.4
1) group_by_dataframe.count().filter("`count` >= 10").orderBy('count', ascending=False) 2) from pyspark.sql.functions import desc group_by_dataframe.count().filter("`count` >= 10").orderBy('count').sort(desc('count'))
Нет необходимости импортировать в 1) и 1) кратко и легко читается,
поэтому я предпочитаю 1) 2)
источник
вы также можете использовать groupBy и orderBy следующим образом
dataFrameWay = df.groupBy("firstName").count().withColumnRenamed("count","distinct_name").sort(desc("count"))
источник