我正在尝试使用 golang 从 html 中提取文本,并且我使用 goquery 库来执行此操作。如下代码:
document, err := goquery.NewDocumentFromReader(r)
if err != nil {
log.Fatalln(err)
}
document.Find("script").Remove()
document.Find("style").Remove()
text := document.Find("body").Text()
您会发现结果仍然包含 html 标签,我怎样才能删除 html 标签并只保留文本?