问题标签 [html-agility-pack]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3552 浏览

c# - HTML 敏捷包屏幕抓取 XPATH 不返回数据

我正在尝试为 Digikey 编写一个屏幕刮板,这将使我们公司能够在零件停产时准确跟踪定价、零件可用性和产品更换。我在 Chrome Devtools 中看到的 XPATH 以及在 Firefox 上看到的 Firebug 与我的 C# 程序看到的似乎存在差异。

我目前正在抓取的页面是http://search.digikey.com/scripts/DkSearch/dksus.dll?Detail&name=296-12602-1-ND

我目前使用的代码非常快速和肮脏......

虽然我使用的路径似乎是“正确的”,但当我查看列表“m_unparsedProductInfoNodes”时,我一直得到 NULL

知道这里发生了什么吗?我还要补充一点,如果我在 baseNode 上执行“SelectNodes”,它只会返回一个 div,其中唯一重要的子节点是“cs=####”,这似乎因浏览器用户代理而异。如果我无论如何都尝试使用它(将 /cs=0 放在无法识别的浏览器的路径中),它会坚持认为我的表达式不会评估为节点集,但留下它们仍然会留下所有数据过去的问题div[2] 返回为 NULL。

0 投票
2 回答
985 浏览

c# - HTML Agility 包中从标签 `< table <` 解析的选项

html 敏捷包中是否有任何选项可以解析&lt&gt.

如果有标签,<table>那么html敏捷包会正确解析标签表中的信息。但是如果标签是这样的,&lt table &lt那么它不会在这里解析标签表中的信息。因此,html 敏捷包中的任何选项也可以解析来自此类标签的信息。

0 投票
3 回答
7011 浏览

c# - 我可以使用 Html Agility Pack 来解析 HTML 片段吗?

可以使用 Html Agility Pack 来解析 html 字符串片段吗?

如:

然后提取所有<b>标签?到目前为止,我看到的所有示例都像 html 文档一样加载。

0 投票
1 回答
1174 浏览

c# - 使用 HTTP Agility Pack 解析 HTML

这是五张表中的一张:

我必须提取值,其中表头是 DATUM 和 Maloprodajna cena [EUR/L]。我正在使用敏捷 HTML 包。

我在获取这些值时遇到了很多麻烦。我开始:

但无法找出仅选择表头为 DATUM 和 Maloprodajna cena[EUR/L] 的值的方法。可以用where子句做到这一点吗?

然后我以这两个查询结束:

是否可以结合这两个查询?我将如何将其转换为 lambda 表达式?我刚开始学习这些东西,我想知道它是如何完成的,这样将来我就不会有这些问题了。

哦,还有一个问题……有人知道任何图形控件吗,因为我必须在图形中显示这些值。我从 Microsoft Chart Controls 开始,但在设置它时遇到了麻烦。因此,如果有人对此有任何经验,我想知道如何设置它,以便 x 轴不会每秒显示所有值...例如:如果我有:10.03.2009、24.03.2009、07.04.2009, 21.04.2009、05.05.2009、06.05.2009 仅显示:10.03.2009、07.04.2009、05.05.2009 等。

我将数据绑定到这样的图形:

我的拳头帖子有很多问题......呵呵,希望我不是模糊不清之类的。感谢您的回复!

0 投票
2 回答
1536 浏览

c# - 如何在 html 敏捷包的帮助下从 html 文件中提取最里面的表格?

我在 html 敏捷包的帮助下解析 html 文件中的表格信息。

现在我可以做到并且它有效。

但是当我要提取的表是最里面的时候。

或者我不知道它在嵌套表中的哪个位置。并且可以有任意数量的嵌套表,我想从中提取具有列名名称、地址的表的信息。

前任。

有很多表,但我想提取具有列名名称、地址的表。所以我该怎么做 ?

0 投票
1 回答
275 浏览

c# - 解析带有空格的表格单元格数据,其中有 td 标签

我在html agility pack的帮助下解析 html 表格信息。现在首先我在该表中找到行

var rows = table.Descendants("tr");

然后我找到每一行的单元格数据

这给了我单元格数据。但是它们之间没有空格,比如NameAdressPhone No但我想要内部文本,比如Name Address Phone No意味着哪里有td 标签,我想在不同的列单元格之间保留一个空格

0 投票
1 回答
3381 浏览

replace - HTML 敏捷包 - ReplaceNode 不会更改正文的 InnerHTML

我有这个

身体:

编码:

在我这样做之后,主体节点的 InnerHtml 保持与从头开始相同,尽管 OutterHtml 或 InnerText 显示出良好的结果。我的代码有问题吗?

结果:

0 投票
3 回答
14461 浏览

html-agility-pack - Html Agility Pack:使代码看起来整洁

我可以使用 Html Agility Pack 使输出看起来很好缩进,去除不必要的空白吗?

0 投票
1 回答
14866 浏览

c# - 使用 HtmlAgilityPack 解析 HTML 页面以按类选择 Div

我将 C# 与 HtmlAgilityPack 一起使用,我可以选择 id 为 foo 的 div

但是我如何选择带有类栏的 div 呢?

0 投票
1 回答
3649 浏览

c# - C# 中是否有允许轻松管理 HTML DOM 的对象?

如果我有一个字符串,其中包含我刚刚从 HTTP Post 返回的页面中的 html,我怎样才能将它变成可以让我轻松遍历 DOM 的东西?

我认为 HtmlDocument 对象会有意义,但它没有构造函数。是否有任何类型可以轻松管理 HTML DOM?

谢谢,
马特