Верните новый RDD, содержащий только элементы, которые удовлетворяют предикату.
rdd = sc.parallelize([1, 2, 3, 4, 5])
rdd.filter(lambda x: x % 2 == 0).collect()
# [2, 4]
Ethercourt.ml