1

我正在尝试遵循此处的示例: https://rust-lang-nursery.github.io/rust-cookbook/web/scraping.html,它同时利用 Reqwest 和 Select 来获取 html 响应然后解析数据.

我使用的是 Reqwest 版本 0.10.4 和 Select 版本 0.4.3,它们是示例中显示的版本。但是,我收到一个错误:

error[E0277]: the trait bound `reqwest::Response: std::io::Read` is not satisfied
  --> src/main.rs:19:25
   |
19 |     Document::from_read(res)?
   |                         ^^^ the trait `std::io::Read` is not implemented for `reqwest::Response`
   | 
  ::: /root/.cargo/registry/src/github.com-1ecc6299db9ec823/select-0.4.3/src/document.rs:31:25
   |
31 |     pub fn from_read<R: io::Read>(mut readable: R) -> io::Result<Document> {
   |                         -------- required by this bound in `select::document::Document::from_read`

似乎 from_read 方法接受了 Read 类型,但 reqwest::get 方法返回了不同的类型。在将响应传递给 from_read 方法之前,是否必须先进行某种转换?

这是一个例子:

#[macro_use]
extern crate error_chain;
extern crate reqwest;
extern crate select;

use select::document::Document;
use select::predicate::Name;

error_chain! {
   foreign_links {
       ReqError(reqwest::Error);
       IoError(std::io::Error);
   }
}

fn main() -> Result<()> {
    let res = reqwest::get("https://www.rust-lang.org/en-US/").await?;

    Document::from_read(res)?
        .find(Name("a"))
        .filter_map(|n| n.attr("href"))
        .for_each(|x| println!("{}", x));

    Ok(())
}
4

1 回答 1

1

reqwest::get返回 a Result<Response>,然后使用?展开Result,这意味着您现在拥有了此处Response记录的对象。并且由于网络调用可以成功发生但仍然失败(请参阅 HTTP 非 200 代码),您应该检查响应代码,但由于这是为了学习,我们将忽略它。您想要的是一个实现该特征的结构,阅读该结构以实现该特征。回过头来看,我们可以使用 方法获取返回的字符串。所以你的代码现在变成了std::io::ReadStringreqwest::Responsetext()

let res = reqwest::get("https://www.rust-lang.org/en-US/")
              .await?
              .text()
              .await?;

从评论更新:现在的问题是Document::from_read只接受std::io::Read作为参数,而std::string::String不是实现该特征,而不是像stringreader我们可以简单地使用Document::from作为文档那样使用板条箱来实现该From<&'a str>特征。

而且,与几乎所有事情一样,有多种方法可以解决这个问题。你也可以

  1. Document::from(res)使用, 或直接从字符串创建文档

  2. 将字符串转换为字节切片,实现读取,并从中创建文档Document::from_read(res.as_bytes())

于 2020-05-25T08:56:14.637 回答