我想知道是否有软件(OSX 或 Win)可以通过在 DOM 中指定开始/结束标签并仅抓取它们之间的 HTML 来抓取网站内容?理想情况下,将所述内容导出为 XML 或 CSV?
问问题
86 次
1 回答
1
我的 Xidel可以做这样的事情。foo
例如,您可以使用 id和以下方式获取 div 之间的所有 div bar
:
<div id="foo"/>
<div>{.}</div>*
<div id="bar"/>
它为此使用模式匹配,因此您可以拥有任意多个具有任意复杂性的开始/结束元素
于 2013-10-22T10:26:44.480 回答