1

我正在用 Go 编写解析器 HTML。我需要获取 HTML 并将其传递给另一个函数。

我这样做了:

  1. 不能将“doc”传递给另一个函数
receivedURL, err := http.Get("http://lavillitacafe.com/")
doc, err := goquery.NewDocumentFromReader(receivedURL.Body)
//"linkScrape" this is another function
contactURL := linkScrape(doc)

  1. HTML 被部分地转移到另一个函数中。
resp, err := http.Get("http://lavillitacafe.com/")
    if err != nil {
        fmt.Println(err)
        return
    }
    defer resp.Body.Close()
    for true {

        bs := make([]byte, 1014)
        n, err := resp.Body.Read(bs)
                contactURL := linkScrape(bs[:n])
        if n == 0 || err != nil{
            break
        }
    }

我该怎么做?

4

1 回答 1

0

goquery这是根据您的用例调整的基本示例:

package main

import (
    "fmt"
    "log"
    "strings"

    "github.com/PuerkitoBio/goquery"
)

func findHeader(d *goquery.Document) string {
    header := d.Find("h1").Text()
    return header
}

func main() {
    // create from a string
    data := `
<html>
    <head>
        <title>My document</title>
    </head>
    <body>
        <h1>Header</h1>
    </body>
</html>`

    doc, err := goquery.NewDocumentFromReader(strings.NewReader(data))
    if err != nil {
        log.Fatal(err)
    }

    fmt.Println(findHeader(doc))
}
于 2019-04-22T13:09:19.300 回答