2

我正在尝试解析该字段,但无法使其正常工作。当前尝试:

HTML:

<div class="movie_data">
<dl>
    <dt><a href="http://www.imdb.com/title/tt1302011/">IMDB</a>:</dt>
    <dd>8.0 / 10</dd>
    <dt>Zvrst:</dt>
    <dd><a href="/sl/kino?t=&amp;g=1&amp;actual=1">komedija</a>, <a href="/sl/kino?t=&amp;g=14&amp;actual=1">animirani</a>, <a href="/sl/kino?t=&amp;g=21&amp;actual=1">družinski</a></dd> 
    <dt>Trajanje:</dt>
    <dd>90 min</dd>
</dl>
</div>

我的代码:

HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument htmlDocTusCelje = web.Load(my_link_to); 
HtmlAgilityPack.HtmlNode nodeOcena = htmlDocTusCelje.DocumentNode.SelectSingleNode("//div[@class='movie_data']/dt/dd[0]");
labelOcena.Text = nodeOcena.InnerText;

我只需要解析<dd>标签中的内部文本,但我得到一个例外:NullReferenceException, Object reference not set to an instance of an object.

我尝试了SelectNodes一个 foreach 循环 - 同样的故事。请帮我摆脱这个错误。

4

1 回答 1

2

您的 xpath 有两个问题:

  1. 索引应该从 1 开始,而不是从 0 开始。
  2. 你写dt而不是dl.

如果 xpath 查询找不到它返回的此类节点null,这会导致您在尝试使用时出错nodeOcena

这似乎有效:

HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='movie_data']/dl/dd[1]");
于 2011-06-11T12:53:53.770 回答