我正在阅读一千行意大利语文本并创建一个独特单词的字典。我尝试了两种删除标点符号的方法:使用字符串
for p in string.punctuation:
word = word.replace(p, str())
或者 :
for line in f:
for word in line.split():
stripped_text =""
for char in word:
if char in '!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~>><<<<?>>?123456789':
char = ''
stripped_text += char
我的问题是这仍然包含标点符号:
{'<<Dicerolti': 1,'piage>>.': 1,'succia?>>.': 1,…}
请问有什么想法吗?