我有以下文本:sherlock.txt 我想为其中的每个单词创建一个列表(标点符号是单词的一部分,因此不是单独的元素,例如:'glad.')。我所做的是:
>>> def wordlist(text):
... input= open(text,'r')
... data= input.read()
... input.close()
... data=data.replace('\n',' ')
... data=data.replace(chr(13),' ')
... data=data.replace(chr(9),' ')
... data=data.split(' ')
... while '' in data:
... data.remove('')
... return data
问题是它返回一个单词列表,但它需要大约。7秒这样做。有没有更快的方法来做到这一点?我知道 while 循环是这里的问题。