Pyspark отличается отбор
df.select('column1').distinct().collect()
Grotesque Gaur
df.select('column1').distinct().collect()