0

这是我用来通过 html 敏捷包获取某些标签的方法。我用这个方法用google local做排名。这似乎需要相当多的时间并且是内存密集型的,有没有人有任何建议可以让它变得更好?

 private void findGoogleLocal(HtmlNode node) {

     String   name        = String.Empty;
     // 
     // ----------------------------------------
     if (node.Attributes["id"] != null) {

       if (node.Attributes["id"].Value.ToString().Contains("panel_") &&   node.Attributes["id"].Value.ToString() != "panel__")
        {
        GoogleLocalResults.Add(new Result(URLGoogleLocal, Listing, node, SearchEngine.Google, SearchType.Local, ResultType.GooglePlaces));
        }
    }

    if (node.HasChildNodes) {
      foreach (HtmlNode children in node.ChildNodes)  {
        findGoogleLocal(children);
      }
    }

  }
4

3 回答 3

2

为什么这个方法必须是递归的?一口气获取所有节点(使用 HAP 中的 Linq 支持的示例):

var results = node.Descendants()
                  .Where(x=> x.Attributes["id"]!= null && 
                             x.Attributes["id"].Value.Contains("panel_") &&  
                             x.Attributes["id"].Value!= "panel__")
                  .Select( x=> new Result(URLGoogleLocal, Listing, x, SearchEngine.Google, SearchType.Local, ResultType.GooglePlaces));
于 2012-04-24T17:35:42.097 回答
2

我只想添加另一个干净、简单且快速的解决方案:使用XPath

var results = node
                .SelectNodes(@"//*[contains(@id, 'panel_') and @id != 'panel__']")
                .Select(x => new Result(URLGoogleLocal, Listing, x, SearchEngine.Google, SearchType.Local, ResultType.GooglePlaces));
foreach (var result in results)
    GoogleLocalResults.Add(result);
于 2012-04-24T18:16:12.670 回答
0

Fizzler:HAP 的 CSS 选择器引擎

http://code.google.com/p/fizzler/

于 2012-04-24T17:22:20.137 回答