问题标签 [kuchiki]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
512 浏览

rust - 捕获无法复制的移动值

我正在使用Kuchiki解析一些 HTML 并使用hyper发出 HTTP 请求,以通过scoped_threadpool对结果进行并发操作。

我选择并迭代列表。我根据列表的数量决定要在线程池中分配的线程数:

当我尝试这样做时,我得到capture of moved value: listings. listingsis kuchiki::iter::Select<kuchiki::iter::Elements<kuchiki::iter::Descendants>>,这是不可复制的——所以我既没有得到隐式克隆也没有得到显式.clone.

在池中,我可以再做document.select("table.listings")一次,它会起作用,但这对我来说似乎没有必要,因为我已经用它来获得计数。我也不需要listings在循环之后。

我有什么办法可以在闭包中使用不可复制的值吗?

0 投票
0 回答
195 浏览

rust - 如何获取一个 HTML 标记作为 2 个字符串(开始标记、结束标记),而没有来自 kuchiki 的内容?

我正在用 Rust 编写 HTML 到 Markdown 转换器,使用 Kuchiki 从 html5ever 访问解析树。

对于未知的 HTML 标记,我想提供忽略它们并将它们传递给输出字符串的可能性,但仍然照常处理它们的子级。为此,我需要没有内容的标签的文本表示,但我不知道如何最好地做到这一点。

我能想到的最好的是:

  1. 克隆节点
  2. 丢弃它的孩子
  3. 称呼node.to_string
  4. 使用正则表达式“解析”字符串以分隔开始标签和结束标签。

我觉得一定有更好的方法。我不认为 Kuchiki 提供了开箱即用的功能,但我也不知道如何通过 Kuchiki 访问 html5ever API,而且我也没有从 html5ever API 文档中获得它们是否会提供一些功能像这样。

0 投票
1 回答
347 浏览

rust - How to get only TEXT_NODE with kuchiki

I have this example HTML which I want to parse with kuchiki:

I want only Bananowy without @.

A similar question for JavaScript: How to get the text node of an element?

0 投票
1 回答
825 浏览

rust - 使用 Kuchiki 解析字节时出现“预期切片,发现 u8”错误

尝试执行以下操作时遇到类型错误:

错误是:

data.as_bytes()返回对字节切片 ( &[u8]) 的引用,所以我对found u8来自哪里感到困惑。我该如何纠正这个错误?

有问题的方法的文档在这里

0 投票
1 回答
126 浏览

html - 如何使用 Kuchiki 获取 HTML 文档的所有文本(script/style/noscript 标签除外)?

我正在尝试获取 HTML 页面上的所有文本,不可见文本除外(例如:我不希望在 script/style/noscript 标记中使用文本)。

到目前为止,这是我想出的:

这个想法是第一遍将删除任何script, style, 或noscript标签。然后我可以打电话text_contents来获取可见的文本。

但是,似乎text_contents仍在返回内联 Javascript。

我是否误解了 Kuchiki/html5ever API?