我正在尝试找到执行以下操作的正则表达式。假设我有一个这种形式的字符串
wordcount = "THE:12 IT:3 TO:3".
这是一个词和它的频率。我需要一个可以找到的正则表达式,例如THe
,后跟:
,后跟一个数字。
如果您想要所有匹配项,请使用扫描方法:
mystring.scan(/\w+:\d+/)
如果您打算进行哈希处理,则有以下好处:
Hash[mystring.scan(/(\w+):(\d+)/)]
# or, if you prefer to not use regexp:
Hash[x.split.map{|y| y.split(':')}]
您可以执行以下操作:
s = "THE:12 IT:3 TO:3"
p s.scan(/\w+:\d+/)
# >> ["THE:12", "IT:3", "TO:3"]