0

如何使用 colly/goquery 在此 html 片段中查找数值:

<body>
 <a href="/xxxx/aaaa" > AAAA </a>,  125.00  <br>
 <a href="/xxxx/bbbb" > BBBB </a>,  235.20  <br>
 <a href="/xxxx/cccc" > CCCC </a>,  145.04  <br>
</body>
4

1 回答 1

1

此代码将为您提供包含空格的字符串部分的数字。您需要修剪这些并解析为数字。

更新:代码现在修剪行并解析为浮点数。

package main

import (
    "fmt"
    "github.com/PuerkitoBio/goquery"
    "log"
    "strconv"
    "strings"
)

func main() {
    html := `<body>
 <a href="/xxxx/aaaa" > AAAA </a>,  125.00  <br>
 <a href="/xxxx/bbbb" > BBBB </a>,  235.20  <br>
 <a href="/xxxx/cccc" > CCCC </a>,  145.04  <br>
</body>`

    reader := strings.NewReader(html)

    doc, err := goquery.NewDocumentFromReader(reader)
    if err != nil {
        log.Fatal(err)
    }

    justText := doc.Text()
    lines := strings.Split(justText, "\n")
    for _, line := range lines {
        if len(line) > 0 {
            parts := strings.Split(line, ",")
            number, err := strconv.ParseFloat(strings.TrimSpace(parts[1]), 64)
            if err != nil {
                fmt.Println(err)
            } else {
                fmt.Println(number)
            }
        }
    }
}


于 2019-10-14T08:03:25.360 回答