问题标签 [anglesharp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - AngleSharp 点击 div
在 AngleSharpIHtmlAnchorElement
中有 DoClick()
方法。就我而言,我需要单击div
. 我该怎么做?
HTML:
C#:
c# - 使用 AngleSharp 库从 href 获取 url
我正在使用带有 AngleSharp 库的 c# 来读取 URL,<a>
我可以使用轻松读取内容
但是我该怎么做,从所有标签的href
属性中读取 URL?<a>
c# - 使用 AngleSharp 解析页面
我想使用带有 AngleSharp 的 c# 解析网站,使用静态页面很容易,但是有一个问题,我无法解析仅对授权用户可用的信息。我应该怎么做才能以编程方式自动进入网站并解析所有对我有用的信息?
c# - AngleSharp 获取所有 HTML 标签并分配唯一的 id 属性
有什么方法可以使用AngleSharp来获取所有身体标签的数量,然后为所有标签分配一个唯一的属性 id,例如“data-id=1”、“data-id=2”等。
我正在为静态网站翻译目的进行测试,然后我将使用查询选择器 [data-id] 并从每个标签中获取 TextContent 并使用翻译 API 翻译文本并将翻译后的文本设置回标签 id where它是从最初提取的。
C#
HTML
c# - 使用 LINQ 从 HTML 文档中提取一组字符串
我正在尝试使用 AngleSharp 解析器从带有 LINQ 的 HTML 文档中提取包含特定关键字的 URL。
我想出了:
有没有更好的方法(更容易编写或运行更快)将 URLS 放入 IEnumerable 或 List ?
c# - AngleSharp 的 Document.DocumentUri 与 Document.Url 有何不同?
Document.Url
: "获取包含当前文档 URL 的字符串。"Document.DocumentUri
: "获取包含当前文档 URL 的字符串。"
有什么不同?
html - 使用 AngleSharp 删除所有特定元素
我们的 CMS Kentico在其最新版本中已从提供HTMLAgilityPack 转移到AngleSharp 。如果我可以避免它并保持提供的内容,我希望不必重新引入HTMLAgilityPack 。我有用户可以通过 DevExpress HTML 编辑器发送的 HTML。我想从该 HTML 和可能的其他标签中删除所有跨度标签,以便 Google 结构化数据可以处理它。我没有看到任何关于如何从 HTML 块中删除所有元素的示例,就像我在HTMLAgilityPack中的三行代码中所做的那样。有没有人有一个很好的例子?
c# - 请求“特殊”网站时超时
我想请求https://www.gesetze-im-internet.de/bgb/__1.html,但后来我超时了,似乎该网站不想被程序读取。
我试图更改 userAgent 并使用不同的库(anglesharp),但没有任何效果:
我该如何解决这个问题?
c# - 防止 AngleSharp 中的重定向
执行请求时是否可以防止任何重定向
还是抓住他们?
c# - 有没有更好的方法来删除跨度元素但留下子节点?
我想删除所有span
元素(没有属性)但保留内部 html。我创建了以下似乎可以工作的代码片段,但我不禁认为这对于这样的任务来说过于复杂。有没有更好的办法?