我正在尝试使用 Scala 解析元标记。我试过用 XML 匹配来做这个,比如
`html // meta ...` etc,
但我收到格式错误的 XML 错误,因为此特定页面上的这些元标记没有结束标记或... />
附件。
所以对于下面的 HTML,
val html = """<meta name="description" content="This is some meta description">"""
我正在使用以下正则表达式匹配器:
val metaDescription = """.*meta name="Description" content="([^"]+)"""".r
- 当我尝试匹配时,
val metaDescription(desc) = html
我得到一个 scala.MatchError。 - 当我尝试
metaDescription.findAllIn(html)
和迭代时,我得到了整个字符串——而不仅仅是描述。
我怎样才能得到里面的价值,content
而不是别的?
编辑
我得到了我想要的结果:
metaDescription.findAllIn(html).matchData foreach {
desc => println(desc.group(1))
}
但这似乎还有很长的路要走。有更好的解决方案吗?