-1

我想知道是否有软件(OSX 或 Win)可以通过在 DOM 中指定开始/结束标签并仅抓取它们之间的 HTML 来抓取网站内容?理想情况下,将所述内容导出为 XML 或 CSV?

4

1 回答 1

1

我的 Xidel可以做这样的事情。foo 例如,您可以使用 id和以下方式获取 div 之间的所有 div bar

<div id="foo"/>
<div>{.}</div>*
<div id="bar"/>

它为此使用模式匹配,因此您可以拥有任意多个具有任意复杂性的开始/结束元素

于 2013-10-22T10:26:44.480 回答