python - 有没有办法解释 Python 中字符串中的所有分隔符？

Question

我正在尝试为一本书（.txt 文件）创建字数统计，并尝试使用以下方法将每一行拆分为单独的单词：

temp = re.split('[; |, |\*|\n| |\|:|.|’|"|&|#|$|(|)|]|//|'']', line)

但是，这不起作用，因为每次我运行程序时，我都必须在列表中添加另一个分隔符。这次我必须添加'-'和'%'。我记得在 Java 中做过类似的事情，我可以指定分隔符的“范围”，当我在这里尝试同样的事情时，它似乎不起作用。

有没有更好的方法来做到这一点，并确保我只是得到这个词而不是别的？

score 2 · Accepted Answer

我认为您正在寻找\W所有非单词字符的集合，即不是字母、数字或下划线。

IE

temp = re.split('\W+', line)

顺便说一句，正则表达式字符集中的字符大多是文字。你的归结为：

[; |,*\n:.’&quot;&#$()]/']

1 回答 1