html - Clojure 中的 HTML 解析

Question

我正在寻找一种在 Clojure 中解析 HTML 的好方法。

我正在尝试做的是使用爬虫获取网页的内容，然后获取一些 HTML 标记或其属性的内容。

所以我有页面的 URL，我将 html 作为字符串，但是如何获取我需要的数据？

score 6 · Accepted Answer

使用https://github.com/cgrand/enlive 它允许您使用类似 CSS 的选择器进行选择和检索。

我对 tag-soup 没有经验，但我可以说 enlive 对大多数抓取都非常有效。

1 回答 1