0

我是 Go 新手。我正在使用goquery从 HTML 页面中提取数据。但问题是我要查找的数据不受任何 HTML 标记的限制。它是<br>标签后的简单文本。我怎样才能提取它?

编辑:这是 HTML 代码。

<div class="container">
    <div class="row">
      <div class="col-lg-8">
        <p align="justify"><b>Name</b>Priyaka</p>
        <p align="justify"><b>Surname</b>Patil</p>
        <p align="justify"><b>Adress</b><br>India,Kolhapur</p>
        <p align="justify"><b>Hobbies&nbsp;</b><br>Playing</p>
        <p align="justify"><b>Eduction</b><br>12th</p>
        <p align="justify"><b>School</b><br>New Highschool</p>
       </div>
    </div>
</div>

从这里我想要“Priyanka”和“12th”。

4

2 回答 2

2

以下是您想要的:

doc.Find(".container").Find("[align=\"justify\"]").Each(func(_ int, s *goquery.Selection) {
    prefix := s.Find("b").Text()
    result := strings.TrimPrefix(s.Text(), prefix)
    println(result)
})

在代码前面导入字符串。如果您需要完整的代码示例,请查看此处

于 2016-04-17T13:07:36.833 回答
0

尝试查询
并获取其兄弟姐妹

http://godoc.org/github.com/PuerkitoBio/goquery#Selection.Siblings

于 2015-07-21T08:33:00.180 回答