我遇到了 XPath 语法问题,因为我不明白如何使用它来提取某些 HTML 语句。我正在尝试从频道页面加载视频信息;http://www.youtube.com/user/CinemaSins/videos
我知道有一条线包含来自视图、标题、ID 等的所有详细信息。
这是我试图从 html 中获取的内容:
那是第 2836 行;
<div class="yt-lockup clearfix yt-lockup-video yt-lockup-grid context-data-item" data-context-item-id="ntgNB3Mb08Y" data-context-item-views="243,456 views" data-context-item-time="9:01" data-context-item-type="video" data-context-item-user="CinemaSins" data-context-item-title="Everything Wrong With The Chronicles Of Riddick In 8 Minutes Or Less">
我不知道怎么做,但是我添加了 HTML 能力包作为资源,并开始尝试获取它。有人可以解释如何获取所有这些细节和涉及的 XPath 语法吗?
我已经尝试过:
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='yt-lockup clearfix yt-lockup-video yt-lockup-grid context-data-item']//a"))
{
if (node.ChildNodes[0].InnerHtml != String.Empty)
{
title.Add(node.ChildNodes[0].InnerHtml);
}
}
^ 以上代码仅用于获取每个视频的标题。但它也有一个空白输入。执行的代码和结果如下。