我只是参与使用 C# 语言和 HtmlAgilityPack 解析一些 html 文件。
我试图为每一行获取两列值以将它们插入数据库。但运行以下内容:
foreach (HtmlNode row in htmlDoc.DocumentNode.SelectNodes("//tr"))
{
foreach (HtmlNode cell in row.SelectNodes("//td"))
{
Console.WriteLine(cell.InnerText);
}
}
当我遍历所有 td 时出现错误,而不仅仅是当前 tr 中包含的那些。
我的 html 看起来像这样:
<table>
<tr>
<th align="center" width="50"><b>column 1</b></th>
<th align="center" width="210"><b>column 2</b></th>
</tr>
<tr bgcolor="#ffffff">
<td align="left"> </td>
<td align="left"></td>
</tr>
<tr bgcolor="#dddddd">
<td align="left"> </td>
<td align="left"></td>
</tr>
<tr bgcolor="#ffffff">
<td align="left"> </td>
<td align="left"></td>
</tr>