我正在尝试为一本书(.txt 文件)创建字数统计,并尝试使用以下方法将每一行拆分为单独的单词:
temp = re.split('[; |, |\*|\n| |\|:|.|’|"|&|#|$|(|)|]|//|'']', line)
但是,这不起作用,因为每次我运行程序时,我都必须在列表中添加另一个分隔符。这次我必须添加'-'和'%'。我记得在 Java 中做过类似的事情,我可以指定分隔符的“范围”,当我在这里尝试同样的事情时,它似乎不起作用。
有没有更好的方法来做到这一点,并确保我只是得到这个词而不是别的?