问题标签 [kuchiki]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

5 问题

0 投票

1 回答

512 浏览

rust - 捕获无法复制的移动值

我正在使用Kuchiki解析一些 HTML 并使用hyper发出 HTTP 请求，以通过 scoped_threadpool对结果进行并发操作。

我选择并迭代列表。我根据列表的数量决定要在线程池中分配的线程数：

当我尝试这样做时，我得到capture of moved value: listings. listingsis kuchiki::iter::Select<kuchiki::iter::Elements<kuchiki::iter::Descendants>>，这是不可复制的——所以我既没有得到隐式克隆也没有得到显式.clone.

在池中，我可以再做document.select("table.listings")一次，它会起作用，但这对我来说似乎没有必要，因为我已经用它来获得计数。我也不需要listings在循环之后。

我有什么办法可以在闭包中使用不可复制的值吗？

rust kuchiki

2016-02-27T16:39:11.597

0 投票

0 回答

195 浏览

rust - 如何获取一个 HTML 标记作为 2 个字符串（开始标记、结束标记），而没有来自 kuchiki 的内容？

我正在用 Rust 编写 HTML 到 Markdown 转换器，使用 Kuchiki 从 html5ever 访问解析树。

对于未知的 HTML 标记，我想提供忽略它们并将它们传递给输出字符串的可能性，但仍然照常处理它们的子级。为此，我需要没有内容的标签的文本表示，但我不知道如何最好地做到这一点。

我能想到的最好的是：

克隆节点
丢弃它的孩子
称呼node.to_string
使用正则表达式“解析”字符串以分隔开始标签和结束标签。

我觉得一定有更好的方法。我不认为 Kuchiki 提供了开箱即用的功能，但我也不知道如何通过 Kuchiki 访问 html5ever API，而且我也没有从 html5ever API 文档中获得它们是否会提供一些功能像这样。

user1115652

2017-02-11T12:24:18.473

0 投票

1 回答

347 浏览

rust - How to get only TEXT_NODE with kuchiki

I have this example HTML which I want to parse with kuchiki:

I want only Bananowy without @.

A similar question for JavaScript: How to get the text node of an element?

rust kuchiki

2019-05-27T15:47:08.510

0 投票

1 回答

825 浏览

rust - 使用 Kuchiki 解析字节时出现“预期切片，发现 u8”错误

尝试执行以下操作时遇到类型错误：

错误是：

data.as_bytes()返回对字节切片 ( &[u8]) 的引用，所以我对found u8来自哪里感到困惑。我该如何纠正这个错误？

有问题的方法的文档在这里。

rust kuchiki

2019-07-12T20:43:53.893

0 投票

1 回答

126 浏览

html - 如何使用 Kuchiki 获取 HTML 文档的所有文本（script/style/noscript 标签除外）？

我正在尝试获取 HTML 页面上的所有文本，不可见文本除外（例如：我不希望在 script/style/noscript 标记中使用文本）。

到目前为止，这是我想出的：

这个想法是第一遍将删除任何script, style, 或noscript标签。然后我可以打电话text_contents来获取可见的文本。

但是，似乎text_contents仍在返回内联 Javascript。

我是否误解了 Kuchiki/html5ever API？

html rust html5ever kuchiki

2021-02-19T07:19:28.970

1 2 3 4 5 6 7 8 9 10

问题标签 [kuchiki]

rust - 捕获无法复制的移动值

rust - 如何获取一个 HTML 标记作为 2 个字符串（开始标记、结束标记），而没有来自 kuchiki 的内容？

rust - How to get only TEXT_NODE with kuchiki

rust - 使用 Kuchiki 解析字节时出现“预期切片，发现 u8”错误

html - 如何使用 Kuchiki 获取 HTML 文档的所有文本（script/style/noscript 标签除外）？

Reference