问题标签 [html-agility-pack]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - HtmlAgilityPack 选择的子节点不符合预期
我正在尝试使用 HtmlAgilityPack 库来解析页面中的一些链接,但我没有看到这些方法所期望的结果。在下面,我有一个 HtmlNodeCollection 链接。对于每个链接,我想检查是否有图像节点,然后解析它的属性,但是 linkNode 的 SelectNodes 和 SelectSingleNode 方法似乎是在搜索父文档而不是 linkNode 的 childNodes 给出了什么?
如果存在,还有其他方法可以获得linkNode的图像子节点的alt属性吗?
c# - Html 敏捷包 - 解析
我想从简单的网站上抓取一个事实列表。每个事实都包含在一个<li>
标签中。我将如何使用 Html Agility Pack 做到这一点?有更好的方法吗?
<li>
标签中包含的唯一内容是事实,仅此而已。
html-agility-pack - 使用 HtmlAgilityPack 修改超链接标签
如何使用 HtmlAgilityPack 替换所有超链接,例如:
这样就只剩下 href 属性了。网址。
这可能吗?
c# - 使用 HTML Agility Pack 时出现编码错误
我正在尝试使用从这个实际站点找到的一些代码来解析 html 文档,但我不断收到解析错误
任何帮助,将不胜感激 :)
c# - 关于编码的问题:如何从 HtmlAgilityPack 输出到 StringWriter 并保留编码?
我正在使用 HtmlAgilityPack 读取 html,对其进行编辑,然后将其输出到 StreamWriter。HtmlAgilityPack Encoding 是 Latin1,StreamWriter 是 UnicdeEncoding。
我在转换中丢失了一些字符,我不想这样。
我似乎无法更改 StreamWriter 的编码。解决这个问题的最佳方法是什么?
html-agility-pack - HTMLAgility Pack - OuterHtml 只读?
嘿,我正在遍历我自己的代码库中的所有链接,并出于本地化原因将它们从 更改<a href="x">
为's。<asp:HyperLink>
我正在为此(和其他事情)使用 HTMLAgilityPack,我只想更改我找到的链接的 OuterHtml 对象..但它是只读的?
我是 HAP 新手,是否需要创建新节点并删除旧节点?有没有人遇到过这个?
谢谢!
c# - 在 InnerHTML 中解析 HTMLAgilityPack
我尝试从 div 中提取 Token2
我设法通过以下方式获得 Token1 和 Token3:
如何使用 HTMLAgilityPack 直接提取 Token2 ?
一个肮脏的选择是用 doc.DocumentNode.SelectNodes("//div").InnerText 中的 string.empty 替换 Token1 和 Token2,但我想它可以用 HTMLAgilityPack 以更干净的方式完成......
.net - HTML Agility Pack 和 Visual Studio C++ 的问题
我需要一个非常简单的 HTML 解析器,它可以在 .NET 环境中从格式良好的 HTML 文档中提取文本、表格。我发现了几个对 HTMLAgilityPack 的引用。我的问题是我在 .NET 框架中使用 Visual C++ 环境。谁能帮助我说明如何将 C# 生成的 .dll 文件的“引用”添加到 VC++ 项目中?甚至可以在 Visual C++ Win32 项目中使用 HTMLAgilityPack 吗?如果您知道可以完成任务的更好/基本 C++ 解析器,请告诉我。谢谢你的帮助。
c# - html 敏捷包删除子项
我在尝试使用 HTML Agility 包删除具有特定 ID 的 div 及其子项时遇到困难。我确定我只是缺少一个配置选项,但它是星期五,我正在努力。
简化的 HTML 运行:
这是我所得到的。敏捷包抛出的错误表明它找不到 div 结构:
这是到目前为止的代码(取自 Stackoverflow ....)
c# - 使用 HtmlAgilityPack 解析 HTML 页面
使用 C# 我想知道如何从这个示例 html 脚本中获取文本框值(即:john):