这个问题(Best way to strip punctuation from a string in Python)涉及从单个字符串中去除标点符号。但是,我希望从输入文件中读取文本,但只打印出所有字符串的一份副本而不结束标点符号。我已经开始这样的事情:
f = open('#file name ...', 'a+')
for x in set(f.read().split()):
print x
但问题是,如果输入文件有,例如,这一行:
This is not is, clearly is: weird
它以不同的方式处理“is”的三种不同情况,但我想忽略任何标点符号并让它只打印“is”一次,而不是三次。如何删除任何类型的结束标点符号,然后将生成的字符串放入集合中?
谢谢你的帮助。(我对 Python 真的很陌生。)