Удалите пунктуацию и специальные характеристики nltk
traindf['title'] =traindf['title'].apply(lambda x: ' '.join([re.sub('[^a-zA-Z]' , "",word) for word in x.split()
]))
Clear Copperhead