Верните RDD с ключами каждого кортежа.

m = sc.parallelize([1, 2), (3, 4)]).keys()
m.collect()
# [1, 3]
Ethercourt.ml