问题标签 [csquery]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - C# - 如何使用 CsQuery 解析非常不规则的文件
我收到一个非常不规则的 HTML 文件。
我需要提取该文件 TD 中的每个文本,结果应该是这样的:
为了得到这个结果,我面临很多问题。
第一个是因为无效的标记,比如跨度内跨度,跨度内跨度,等等......
第二个是因为它需要一些实时解析,以评估其中的<style>
标签。
Style 标签和 Style 属性说明了哪些元素应该出现,哪些不应该出现。
我正在使用 C# + CsQuery 来提取这个结果,但是,直到现在,还没有成功。
IP var 返回如下内容:
如果我更改 IP var 以获取 HTML:
它返回如下内容:
如何让 IP 显示正确的值?
c# - C# - 如何使用 CSQuery 获取链接锚点
我得到当前页面上的所有链接,然后我寻找我需要的链接,然后我想获得这个链接的锚点(“a”的打开和结束标记之间的文本)。我尝试使用“obj.GetAttribute("innerText")”,但它返回一个空字符串。
c# - C# 通过 GET 查询和 CsQuery 登录站点
社区!我需要你的帮助。我遇到了必须登录网站才能解析一些信息的问题。我找不到如何通过 CsQuery 登录网站的信息,但我找到了可以通过 WebClient 或 WebRequest 登录网站然后使用 CsQuery 解析的信息。但是我怎样才能联合 WebRequest 和 CsQuery 呢?
附加信息:
- 使用 GET 查询。
- 当我第一次登录时保存 cookie。
- 登录表单在弹出窗口中(模态窗口)
对不起,如果我重复了,但我找不到我需要的信息。谢谢您的帮助。
c# - CsQuery/JQuery 无法从谷歌搜索中获取元素
我正在尝试获取谷歌“定义词”搜索的结果。根据 Chrome 的 Inspect Elements ,我想要的文本在 "div class="lr_dct_ent vmod" data-hveid="28"" 类下,我正在使用此代码尝试执行此操作:
这些都不会在控制台中返回任何内容,只是空行。如果我使用“div”而不是“.lr_dct_ent.vmod”,我会得到很多文本,其中一个是我想要的文本,这让我相信“.lr_dct_ent.vmod”不是我应该搜索的方式我想要的 div 类。但根据我找到的每一份文件,这就是我应该这样做的方式。谷歌只是一个特例,还是我在这里很特别?
c# - 通过 CsQuery 获取 HTML 元素的宽度
2017 年 6 月 6 日更新:感谢 jdweng 的帮助,似乎 CsQuery 没有获取元素的 offSetHeight 和 offSetWidth 的方法。
我在 C# 中使用 CsQuery 来分析静态 HTML 文件,并希望获取
元素。
但似乎csquery的IDomObject没有获取Height或Width的方法。
请注意,高度或宽度没有列在 Style 属性中,所以我无法通过:</p>
此外,HTML 文件保存在本地驱动器中,而不是通过 aspx 文件生成的。
任何建议,将不胜感激。
c# - c# - 尝试使用 CsQuery 遍历网页中的有序列表时出错
所以我最初在几天前发布请求帮助开发一个加载网页并从有序列表标签中过滤出所需内容的项目。
一位用户非常有帮助地向我提供了如何使用 Jsoup 来做到这一点的方法,如下所示。
虽然它在我的家用电脑上运行得非常好,但我也想在我的 discord 服务器上实现它,我的机器人的其余部分是用 C# 编写的。
幸运的是,事实证明 Csquery 具有相同的处理方式,使用 CSS 选择器和诸如此类的东西来过滤数据。但是,我在将 Java 代码转换为正确的 C# 时遇到了一些问题,主要是因为我使用了一组单独的库,并且不完全确定 CsQuery 背后的框架。
错误:
-
c# - CsQuery 过滤器 html
我有一段 html 代码,它代表圣经中詹姆斯书的第二节:
我最终只想将经文编号和文本作为字符串返回。我正在尝试使用 CsQuery 来检索某些跨度类,因此我可以省略不需要的类。例如,将类“content”和类“body”作为字符串返回。我目前只能显示一个跨度类,代码如下:
任何帮助将不胜感激
.net - 删除特定标记后的 HTML 标记
我正在尝试从 HTML 字符串中删除一些 HTML 标记。
我的 HTML 如下所示:
我试过的是
但它不工作。它给了我删除的节点。我想要删除节点后剩余的 html。CSQuery 甚至 .NET 字符串替换解决方案也适用于我。
预期结果是
jquery - 使用 jQuery/csQuery 获取存储在 OnClick 事件中的 HREF 属性
任何人都知道选择器可能会是什么样子?我正在寻找提取https://www.getthishref.com。