我正在寻找一种在 Clojure 中解析 HTML 的好方法。
我正在尝试做的是使用爬虫获取网页的内容,然后获取一些 HTML 标记或其属性的内容。
所以我有页面的 URL,我将 html 作为字符串,但是如何获取我需要的数据?
使用https://github.com/cgrand/enlive 它允许您使用类似 CSS 的选择器进行选择和检索。
或https://github.com/nathell/clj-tagsoup
我对 tag-soup 没有经验,但我可以说 enlive 对大多数抓取都非常有效。