简而言之,我试图用空格替换行内单词中的任何标点符号。
例如,一旦处理,文本文档输出将没有像这样的标点符号。
喵喵喵!我说我taw了一个腻子tat。我做到了,我做到了,我做到了,我做了一个腻子 tat Shsssssssssh 我正在狩猎 wabbits 嘿嘿嘿嘿嘿 现在是狩猎 wabbits 的好日子 嘿嘿嘿 停止它的 wabbit 狩猎季节 Huntin Wabbits 最终指南 101 种 kook wabbit 的方法
没有改变它看起来像这样。
来自 question5.txt 的文本
喵喵喵!我说我taw了一个腻子tat。我做到了!我做到了!我确实涂了一个腻子。Shsssssssssh ...我在打猎鹬。嘿嘿嘿嘿嘿……今天是猎兔兔的好日子!... 嘿嘿嘿... 停止 - 这是 wabbit Huntin 季节!Huntin Wabbits:101 种 kook wabbit 的终极指南。
这是一个练习,所以我被告知使用 .replace 和 for 循环。
import string
infile = open('question5.txt', 'r')
lines = infile.readlines()
lines = str(lines)
for words in lines:
for letters in words:
letters.replace(string.punctuation,' ')
print(letters)
任何解决问题的帮助将不胜感激。
请注意,在您的建议和一些研究之后,如果有人关注结果,我会在更多小时后结束。谢谢大家波
import string
infile = open('question5.txt', 'r')
lines = infile.readlines()
def word_count(list):
count = 0
list = str(list)
for lines in list:
list = list.replace('.',' ')
list = list.replace(',',' ')
list = list.replace('-',' ')
split = list.split()
print (split)
for words in split:
count = count + 1
return count
for line in lines:
count = word_count(line)
print(count)
infile.close()