0

我正在尝试使用 Html Agility Pack 解析 HTML 代码。有没有可用的教程,或者有人可以告诉我如何从<td>没有 ID 和课程的人那里获取文本?

    <table id="results-table">
    <tr class="row1">
    <td>Diode Zener Single 12V 5% 1W 2-Pin DO-41 Bulk</td> 
    ...

每行包含 10 个不同的<td>. 谢谢!

4

3 回答 3

3

您可以尝试使用它XPATH来查询您拥有的所有tdstableid="results-table"

//table[@id='results-table']/tr/td

Firepath for Firefox 可以帮助您制定 XPATH,您可以从那里操作它。

下面的示例代码

HtmlDocument doc = new HtmlDocument();
var fileName = @"..\..\..\docs\10960189.htm";
doc.Load(fileName);

var nodes = doc.DocumentNode.SelectNodes("//table[@id='results-table']/tr/td");

foreach (var node in nodes)
{
    Debug.WriteLine(node.InnerText);
}

高温高压

于 2012-06-09T12:28:11.053 回答
2

这是一个解释如何使用 XPath 的链接:

http://www.w3schools.com/xpath/

于 2012-06-10T14:25:52.023 回答
0

我猜你的一些 td 标签会有类/id。使用以下代码。我在 linqpad 上写的

void Main()
{
    var webGet = new HtmlAgilityPack.HtmlDocument();
    //web page/string that need to be parsed
    webGet.LoadHtml(@"<table id='results-table'>" +
                                "<tr class='row1'>" + 
                                "<td class='testclass'>test td with class</td>" + 
                                "<td id='testid'>test td with id</td>" + 
                                "<td>Diode Zener Single 12V 5% 1W 2-Pin DO-41 Bulk</td>" + 
                                "<td>test td without class or id</td>" + 
                                "<tr/>"
                                );

    var tableOnPage = (from tds in webGet.DocumentNode.Descendants()
                      where lnks.Name == "td" &&
                            lnks.Attributes["class"] == null && tds.Attributes["id"] == null &&
                            tds.ParentNode.InnerText.Trim().Length > 0 && lnks.InnerText.Trim().Length > 0 
                     select new
                     {
                         td = tds.DescendantNodes().SingleOrDefault ().InnerHtml.Trim(),
                     });

    //looping through each items
    foreach (var item in tableOnPage)
    {
        Console.WriteLine(item.td);
    }
}

输出将是

二极管齐纳单 12V 5% 1W 2-Pin DO-41 散装

测试没有类或 id 的 td

于 2012-08-10T06:28:37.373 回答