问题标签 [html-agility-pack]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
24672 浏览

c# - HtmlAgilityPack 选择的子节点不符合预期

我正在尝试使用 HtmlAgilityPack 库来解析页面中的一些链接,但我没有看到这些方法所期望的结果。在下面,我有一个 HtmlNodeCollection 链接。对于每个链接,我想检查是否有图像节点,然后解析它的属性,但是 linkNode 的 SelectNodes 和 SelectSingleNode 方法似乎是在搜索父文档而不是 linkNode 的 childNodes 给出了什么?

如果存在,还有其他方法可以获得linkNode的图像子节点的alt属性吗?

0 投票
1 回答
7341 浏览

c# - Html 敏捷包 - 解析
  • 我想从简单的网站上抓取一个事实列表。每个事实都包含在一个<li>标签中。我将如何使用 Html Agility Pack 做到这一点?有更好的方法吗?

    <li>标签中包含的唯一内容是事实,仅此而已。

    0 投票
    1 回答
    2171 浏览

    html-agility-pack - 使用 HtmlAgilityPack 修改超链接标签

    如何使用 HtmlAgilityPack 替换所有超链接,例如:

    这样就只剩下 href 属性了。网址。

    这可能吗?

    0 投票
    1 回答
    1987 浏览

    c# - 使用 HTML Agility Pack 时出现编码错误

    我正在尝试使用从这个实际站点找到的一些代码来解析 html 文档,但我不断收到解析错误

    任何帮助,将不胜感激 :)

    0 投票
    3 回答
    2947 浏览

    c# - 关于编码的问题:如何从 HtmlAgilityPack 输出到 StringWriter 并保留编码?

    我正在使用 HtmlAgilityPack 读取 html,对其进行编辑,然后将其输出到 StreamWriter。HtmlAgilityPack Encoding 是 Latin1,StreamWriter 是 UnicdeEncoding。

    我在转换中丢失了一些字符,我不想这样。

    我似乎无法更改 StreamWriter 的编码。解决这个问题的最佳方法是什么?

    0 投票
    2 回答
    2199 浏览

    html-agility-pack - HTMLAgility Pack - OuterHtml 只读?

    嘿,我正在遍历我自己的代码库中的所有链接,并出于本地化原因将它们从 更改<a href="x">为's。<asp:HyperLink>我正在为此(和其他事情)使用 HTMLAgilityPack,我只想更改我找到的链接的 OuterHtml 对象..但它是只读的?

    我是 HAP 新手,是否需要创建新节点并删除旧节点?有没有人遇到过这个?

    谢谢!

    0 投票
    1 回答
    5911 浏览

    c# - 在 InnerHTML 中解析 HTMLAgilityPack

    我尝试从 div 中提取 Token2

    我设法通过以下方式获得 Token1 和 Token3:

    如何使用 HTMLAgilityPack 直接提取 Token2 ?

    一个肮脏的选择是用 doc.DocumentNode.SelectNodes("//div").InnerText 中的 string.empty 替换 Token1 和 Token2,但我想它可以用 HTMLAgilityPack 以更干净的方式完成......

    0 投票
    1 回答
    914 浏览

    .net - HTML Agility Pack 和 Visual Studio C++ 的问题

    我需要一个非常简单的 HTML 解析器,它可以在 .NET 环境中从格式良好的 HTML 文档中提取文本、表格。我发现了几个对 HTMLAgilityPack 的引用。我的问题是我在 .NET 框架中使用 Visual C++ 环境。谁能帮助我说明如何将 C# 生成的 .dll 文件的“引用”添加到 VC++ 项目中?甚至可以在 Visual C++ Win32 项目中使用 HTMLAgilityPack 吗?如果您知道可以完成任务的更好/基本 C++ 解析器,请告诉我。谢谢你的帮助。

    0 投票
    3 回答
    8360 浏览

    c# - html 敏捷包删除子项

    我在尝试使用 HTML Agility 包删除具有特定 ID 的 div 及其子项时遇到困难。我确定我只是缺少一个配置选项,但它是星期五,我正在努力。

    简化的 HTML 运行:

    这是我所得到的。敏捷包抛出的错误表明它找不到 div 结构:

    这是到目前为止的代码(取自 Stackoverflow ....)

    0 投票
    2 回答
    39103 浏览

    c# - 使用 HtmlAgilityPack 解析 HTML 页面

    使用 C# 我想知道如何从这个示例 html 脚本中获取文本框值(即:john):