我有一个包含 uss,uss,ussr 的文本文件想读取特定单词和单词“uss”的长度如何使用 python 读取
问问题
1238 次
2 回答
2
import re
def findwords(text, length):
return re.findall(r"\b\w{{{0}}}\b".format(length), text)
\b
是一个词边界,确保只有整个词匹配。
r"\w{{{0}}}".format(3)
结果r"\w{3}"
。双括号是转义所必需的。
\w
匹配字母数字字符;如果您想避免匹配数字或下划线,请[^\W\d_]
在其位置使用:
def findwords(text, length):
return re.findall(r"\b[^\W\d_]{{{0}}}\b".format(length), text)
于 2012-09-29T06:01:05.617 回答
0
为什么不使用正则表达式?
import re
help(re)
http://docs.python.org/library/re.html
为了您的麻烦,您可以使用以下正则表达式:
- r'\w{3}'
:匹配 3 个字符(无数字)
您可以\s
在匹配空间或制表符之前或之后添加。
于 2012-09-29T05:33:42.513 回答