-3

我正在尝试使用 golang 从 html 中提取文本,并且我使用 goquery 库来执行此操作。如下代码:

document, err := goquery.NewDocumentFromReader(r)
if err != nil {
    log.Fatalln(err)
}
document.Find("script").Remove()
document.Find("style").Remove()
text := document.Find("body").Text()

测试html页面: 在此处输入图像描述

但结果: 在此处输入图像描述

您会发现结果仍然包含 html 标签,我怎样才能删除 html 标签并只保留文本?

4

1 回答 1

1

将 ul 元素从文本区域中取出。它被视为自己的文本。 在此处输入图像描述

于 2016-09-23T16:33:11.420 回答