0

我正在尝试使用TFHpple来抓取网页,但我不知道的语法

searchWithXPathQuery

我需要从任意网页获取标题、描述和图像列表,

目前的代码类似于

NSData  * data      =     [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://www.google.com"]];

TFHpple * doc       = [[TFHpple alloc] initWithHTMLData:data];

NSArray *arr =    [doc searchWithXPathQuery:@"//title"];
TFHppleElement *titleElem = [arr firstObject];
NSString *titleStr = titleElem.text;
NSLog(@"arr = %@",arr);

我希望这可以检索所有节点

arr = [doc searchWithXPathQuery:@"//"];

但事实并非如此。

我不在乎将框架更改为另一个框架。

做到这一点的最佳策略是什么?

4

1 回答 1

0

查看https://github.com/nolanw/HTMLReader

    NSURL *sUrl = [NSURL URLWithString:@"http://www.apple.com/"];
    NSData *htmlData = [NSData dataWithContentsOfURL:sUrl];
    NSString *markUp = [NSString stringWithUTF8String:[htmlData bytes]];
    HTMLDocument *site = [HTMLDocument documentWithString:markUp];
    NSString *siteTitle = [site firstNodeMatchingSelector:@"title"].textContent;
于 2014-09-03T19:26:13.523 回答