我需要从 HTML 文件中提取信息。对于它们中的大多数,我只需要匹配特定 DOM 元素的内容或属性,所以我使用 XPATH 表达式//a[@class="targeturl"]/@href
和命令行工具xidel。
在另一批文件中,我想要的信息在一个script
,不太容易获得:
<html>
<head><!-- ... --></head>
<body>
...
<script>
...
var o = {
"numeric": 1234,
"target": "TARGET",
"urls": "http://example.com",
// Commented pair "strings": "...",
"arrays": [
{
"more": true
}
,
{
"itgoeson": true
}
]
};
</script>
...
</body>
</html>
请注意,包含我要获取的值的对象不是有效的 JSON。但是,它似乎每行尊重一个键值对。
我可以通过什么xidel --xpath "???"
来得到这个TARGET
?
match
我已经用 XPATH 函数尝试了不同的东西,但是如果没有管道到其他命令(告诉我是/否,replace
逐行工作......等),我无法找到解决方案。