5

我在我的 iOS 应用程序中使用 hpple 解析库。https://github.com/topfunky/hpple

我遇到了一个问题,即解析器在 iOS 7 上没有正确解析我的 HTML 页面。它在 iOS 6 上被正确解析,我得到了返回的对象。在 iOS 7 上,我只返回了部分解析和错误的解析。该库在 iOS 7 上错误地读取了 HTML。我已尝试调试问题并得出结论,问题出在此方法上。

NSArray *PerformXPathQuery(xmlDocPtr doc, NSString *query)
{
  xmlXPathContextPtr xpathCtx;
  xmlXPathObjectPtr xpathObj;

  /* Create xpath evaluation context */
  xpathCtx = xmlXPathNewContext(doc);
  if(xpathCtx == NULL)
    {
      //NSLog(@"Unable to create XPath context.");
      return nil;
    }

  /* Evaluate xpath expression */
  xpathObj = xmlXPathEvalExpression((xmlChar *)[query cStringUsingEncoding:NSUTF8StringEncoding], xpathCtx);
  if(xpathObj == NULL) {
    //NSLog(@"Unable to evaluate XPath.");
    xmlXPathFreeContext(xpathCtx);
    return nil;
  }

  xmlNodeSetPtr nodes = xpathObj->nodesetval;
  if (!nodes)
    {
      //NSLog(@"Nodes was nil.");
      xmlXPathFreeObject(xpathObj);
      xmlXPathFreeContext(xpathCtx);
      return nil;
    }

  NSMutableArray *resultNodes = [NSMutableArray array];
  for (NSInteger i = 0; i < nodes->nodeNr; i++)
    {
      NSDictionary *nodeDictionary = DictionaryForNode(nodes->nodeTab[i], nil,false);
      if (nodeDictionary)
        {
          [resultNodes addObject:nodeDictionary];
        }
    }

  /* Cleanup */
  xmlXPathFreeObject(xpathObj);
  xmlXPathFreeContext(xpathCtx);

  return resultNodes;
}

调用此方法时,doc 和 query 不为零。我不知道如何在此方法中记录其他类,也不知道其中哪一个返回了错误的解析。也许问题出在苹果的 libxml2.dylib

直到方法结束,我才确切知道代码在方法中做了什么。任何帮助都将不胜感激,因为我很困惑为什么该库无法在 iOS 7 上解析它可以在 iOS 6 上解析的相同 HTML 页面。

在 iOS 7 上,这个库可以正确解析其他应用程序中的其他 HTML 页面。我用来解析启动解析器的代码是

 NSData *htmlData = [NSData dataWithContentsOfURL:dataURL];

    TFHpple *dataParser = [TFHpple hppleWithHTMLData:htmlData];

    NSString *dataXpathQueryString = @"//td[3]";
    NSArray *dataNodes = [dataParser searchWithXPathQuery:dataXpathQueryString];

    NSMutableArray *newData = [[NSMutableArray alloc] initWithCapacity:0];
    for (TFHppleElement *element in dataNodes) {

        data = [[GFCData alloc] init];
        [newData addObject:data];
        data.title = [[element firstChild] content];

        data.title = [data.title stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
    }

其中 dataURL 是http://www.gfchurch.com/ru/pages/video.php?a=5&b=51&c=37

如果需要,我可以提供更多信息。

4

2 回答 2

1

这个问题通过不使用//searchPathQuery. 我应该再次测试这个问题,因为库是一个月前更新的,也许问题已经解决了。

于 2014-01-04T01:19:45.003 回答
-2

我通过@xmlXPathRegisterNs@ 正确管理命名空间解决了这个问题

我没有解析 HTML 的问题,而是 SOAP 响应。

于 2013-09-20T09:40:08.847 回答