当我使用scan(/\p{graph}+/)
它时:
"ich gehe nach Köln am 12.09.2012".scan(/\p{graph}+/)
=> ["ich", "gehe", "nach", "Köln", "am", "12.09.2012"]
但是如果出现像“ Köln.am
”这样的输入错误,那么输出是错误的:
"ich gehe nach Köln.am 12.09.2012".scan(/\p{graph}+/)
=> ["ich", "gehe", "nach", "Köln.am", "12.09.2012"]
当我使用scan(/\p{alnum}+/)
时,日期不正确:
"ich gehe nach Köln.am 12.09.2012".scan(/\p{alnum}+/)
=> ["ich", "gehe", "nach", "Köln", "am", "12", "09", "2012"]
有谁知道另一种解决方案?