问题标签 [csquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1231 浏览

c# - 你能用csquery按属性找到html元素吗

我可以使用 csquery 来查找具有特定属性和特定值的 html。

所以如果我有一个页面有这样的东西

然后我可以通过搜索属性与左值对齐的 div 来获取孔线吗?甚至只是 html 元素,然后从属性中获取值?

一如既往,感谢您的帮助和时间。

0 投票
1 回答
308 浏览

c# - CsQuery 使用 Environment.NewLine 将 CQ 对象呈现为 html 字符串的目的是什么?

我正在使用 CsQuery 库(类似于 HtmlAgilityPack)进行 html 处理:

Html 字符串 -> CQ dom -> (.. 操作 ..) -> Manipulated CQ dom -> Html 字符串。

输出字符串需要存储在数据库中,但它充满了“\n”字符(我在 Windows 上)。在插入数据库之前,我正在删除那些(创建一个没有它们的全新字符串)。

如果输出不是 100% html 字符串,那么将 CQ dom 对象渲染为 html 字符串的目的是什么?

我可以在没有“\n”字符的情况下进行渲染吗?

0 投票
1 回答
78 浏览

jquery - CsQuery 中的 $(this) 等价物

csquery 中是否有 $(this) 的等价物。在下面的示例中,letterbody 字符串具有 html 内容。我想在每个标签之前准备文本。

0 投票
0 回答
186 浏览

c# - 使用 CsQuery 在 C# 中读取 xml 文件

以上是我到目前为止编写的代码,我试图从给定的 xml 代码示例中提取 MANUFACTURER 和 MODEL。当我编译时,我收到一条错误消息,说找不到源,我认为这可能是我的设置有问题,我不清楚究竟应该将什么作为参数进入我的 CQ.Create() (我试着把在确切的parts.xml 文件中,但这没有帮助)。

0 投票
1 回答
259 浏览

c# - CsQuery 替换标签

我使用 CsQuery 来解析 HTML 文档。我要做的是用“。”替换所有“br”HTML标签。特点。

假设这是我的输入 HTML:

请求的输出将是:

伪代码:

这可能吗?

感谢您的建议。

0 投票
1 回答
256 浏览

c# - CsQuery 删除评论

我正在获取一个 URL 并通过调用以下方式获取其所有内容:

我注意到“Text()”方法还提取了 HTML 注释,例如:

我正在寻找一些选项来从代码中删除所有这些注释。像这样的东西:

这可能吗?

谢谢

0 投票
2 回答
530 浏览

javascript - 如何使用 CsQuery 删除 html 内容中的所有脚本标签

我正在使用 CsQuery 库进行爬网。代码是这样的。

例如,我不想在resultText这部分使用脚本标签<script> somethings </script>

我试过这个dom[cssSelector].Not("script").Text();。但不工作。

如何删除所有脚本值?

0 投票
1 回答
58 浏览

jquery - csQuery 从被操纵的dom中选择元素?

我正在从一个工作得很好的文件中渲染 dom。然后我使用带有点击事件的 jQuery 操作 dom。

我的问题是:我现在如何从后面的代码中获取被操纵的元素?

0 投票
2 回答
868 浏览

c# - CsQuery - 查找具有具体名称的元素

我必须像这样解析html:

在这个菜单中(如您所见),所有班级都有不止一个孩子。如果我只有名称“Interesting”,如何使用 csQuery 获得“any_url_2”?

0 投票
2 回答
513 浏览

c# - CSQuery解析非英文文本

我正在使用 CSQuery 来解析阿拉伯语网站。当我使用 text() 函数时,它按原样返回文本,但是当我使用 html() 函数时,它使用 html 编码。例如这是我的 html 标签:

当我使用:

它返回:“تعلن عن إرسالها مركبة فضائية لمريخ قريباً جداً”。但是,当我使用:

它返回:

问题是如何在不编码的情况下保留实际文本的同时使用 Html?我需要 Html() 函数来检索选择器标记内的任何现有标记。

编辑:这是原始 html 页面的内容类型: