问题标签 [kuchiki]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rust - 捕获无法复制的移动值
我正在使用Kuchiki解析一些 HTML 并使用hyper发出 HTTP 请求,以通过scoped_threadpool对结果进行并发操作。
我选择并迭代列表。我根据列表的数量决定要在线程池中分配的线程数:
当我尝试这样做时,我得到capture of moved value: listings
. listings
is kuchiki::iter::Select<kuchiki::iter::Elements<kuchiki::iter::Descendants>>
,这是不可复制的——所以我既没有得到隐式克隆也没有得到显式.clone
.
在池中,我可以再做document.select("table.listings")
一次,它会起作用,但这对我来说似乎没有必要,因为我已经用它来获得计数。我也不需要listings
在循环之后。
我有什么办法可以在闭包中使用不可复制的值吗?
rust - 如何获取一个 HTML 标记作为 2 个字符串(开始标记、结束标记),而没有来自 kuchiki 的内容?
我正在用 Rust 编写 HTML 到 Markdown 转换器,使用 Kuchiki 从 html5ever 访问解析树。
对于未知的 HTML 标记,我想提供忽略它们并将它们传递给输出字符串的可能性,但仍然照常处理它们的子级。为此,我需要没有内容的标签的文本表示,但我不知道如何最好地做到这一点。
我能想到的最好的是:
- 克隆节点
- 丢弃它的孩子
- 称呼
node.to_string
- 使用正则表达式“解析”字符串以分隔开始标签和结束标签。
我觉得一定有更好的方法。我不认为 Kuchiki 提供了开箱即用的功能,但我也不知道如何通过 Kuchiki 访问 html5ever API,而且我也没有从 html5ever API 文档中获得它们是否会提供一些功能像这样。
rust - How to get only TEXT_NODE with kuchiki
I have this example HTML which I want to parse with kuchiki:
I want only Bananowy
without @
.
A similar question for JavaScript: How to get the text node of an element?
rust - 使用 Kuchiki 解析字节时出现“预期切片,发现 u8”错误
尝试执行以下操作时遇到类型错误:
错误是:
data.as_bytes()
返回对字节切片 ( &[u8]
) 的引用,所以我对found u8
来自哪里感到困惑。我该如何纠正这个错误?
有问题的方法的文档在这里。
html - 如何使用 Kuchiki 获取 HTML 文档的所有文本(script/style/noscript 标签除外)?
我正在尝试获取 HTML 页面上的所有文本,不可见文本除外(例如:我不希望在 script/style/noscript 标记中使用文本)。
到目前为止,这是我想出的:
这个想法是第一遍将删除任何script
, style
, 或noscript
标签。然后我可以打电话text_contents
来获取可见的文本。
但是,似乎text_contents
仍在返回内联 Javascript。
我是否误解了 Kuchiki/html5ever API?