-2

可能重复:
在给定 html 中的所有标签之间获取文本并递归遍历链接

如何使用敏捷包提取标签之间的单词和信息?我只是忽略我的 html 代码中的所有标签并获取这些标签之间的所有单词。html代码已被我保存在一个字符串中!现在我想用敏捷包来完成这个??

4

1 回答 1

0

出色地,

这取决于。例如,如果一个标签有一个类并且它是唯一的——它是一个函数,但是如果有多个标签,你需要根据标签位置来思考和创建你的函数,另一种没有标签的情况,你会必须计算 html 元素;例如,您可能还需要遍历表行。

下面的示例与您需要的类似。(不确定它是否仍然有效,因为如果页面布局发生变化,它可能会失败。)但它给出了这个想法,你可以从那里开始。

PS - 提问时请给出确切的问题,而不是模糊的解释。

                String openUrl = @"http://www.ebay.com/sch/-/11724/i.html?_nkw=" + some_part_number + "&_armrs=1&LH_Complete=1";

                HtmlWeb hw = new HtmlWeb();
                hw.UserAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)";
                HtmlAgilityPack.HtmlDocument doc = hw.Load(openUrl);

                foreach (HtmlNode nd in doc.DocumentNode.SelectNodes("//tr[@itemprop='offers']"))
                {
                    String title = "";
                    title = Regex.Split(nd.InnerHtml.ToString(), ("title='"))[1].Trim();
                    title = Regex.Split(title, "'")[0].Trim();
                }
于 2012-12-01T18:57:59.707 回答