5

我正在寻找一种在 Clojure 中解析 HTML 的好方法。

我正在尝试做的是使用爬虫获取网页的内容,然后获取一些 HTML 标记或其属性的内容。

所以我有页面的 URL,我将 html 作为字符串,但是如何获取我需要的数据?

4

1 回答 1

6

使用https://github.com/cgrand/enlive 它允许您使用类似 CSS 的选择器进行选择和检索。

https://github.com/nathell/clj-tagsoup

我对 tag-soup 没有经验,但我可以说 enlive 对大多数抓取都非常有效。

于 2013-09-10T18:46:22.203 回答