3

我不太了解htmlparser 的自述文件.. 我在互联网上进行了搜索,但找不到合适的教程(或其他 NodeJS 解析器)。

我相信在大多数情况下,如果没有一个非常完整和旧的库的教程,这主要是因为它很容易做到,因此人们并不觉得有必要为它编写教程......但我发现 NodeJS html 解析器是好难理解……

4

1 回答 1

6

您应该查看htmlparser2。这是较新的 htmlparser,它有一个不错的自述文件。我倾向于使用它的方式不是流式的,因此看起来像这样:

handler = new htmlparser.DomHandler(function(err, dom) {
    // ... DO CODE HERE
})
new htmlparser.Parser(handler).parseComplete(html_string)

对于处理函数内部的代码,我使用了soupselect,因为它有文档而且我很懒,但是htmlparser2 的人建议使用domutils,但它没有文档。

于 2013-06-29T00:52:35.253 回答