如果您使用@"//tr/td"
而不是@"//TR/TD"
.
但是,查看您的 HTML,由于其作者显然不知道如何拼写 CSS,因此您在整个源代码中都隐藏了字体标签。因此,您的下一行代码显然取自Ray Wenderlich 网站上的 Matt Galloway 的优秀 Hpple 教程,它说:
tutorial.title = [[element firstChild] content];
但这在这里行不通,因为对于您的大多数条目, thefirstChild
不是text
,而是一个font
标签。所以你可以检查它是否是这样的字体标签:
TFHppleElement *subelement = [element firstChild];
if ([[subelement tagName] isEqualToString:@"font"])
subelement = [subelement firstChild];
tutorial.title = [subelement content];
或者,您也可以只搜索@"//tr/td/font"
而不是@"//tr/td"
. 这里有很多方法。诀窍(就像所有的 HTML 解析一样)将使其相当健壮,这样您就不会受到页面的细微修饰调整的影响。
显然,您的 HTML 没有 URL,因此该代码不适用于此处。
无论如何,我希望这足以让你继续前进。
你报告有问题,所以我想我只是提供一个更完整的代码示例:
NSURL *tutorialsUrl = [NSURL URLWithString:@"http://www.neiu.edu/~neiutemp/PhoneBook/alpha.htm"];
NSData *tutorialsHtmlData = [NSData dataWithContentsOfURL:tutorialsUrl];
TFHpple *tutorialsParser = [TFHpple hppleWithHTMLData:tutorialsHtmlData];
NSString *tutorialsXpathQueryString = @"//tr/td";
NSArray *tutorialsNodes = [tutorialsParser searchWithXPathQuery:tutorialsXpathQueryString];
if ([tutorialsNodes count] == 0)
NSLog(@"nothing there");
else
NSLog(@"There are %d nodes", [tutorialsNodes count]);
NSMutableArray *newTutorials = [[NSMutableArray alloc] initWithCapacity:0];
for (TFHppleElement *element in tutorialsNodes) {
Tutorial *tutorial = [[Tutorial alloc] init];
[newTutorials addObject:tutorial];
TFHppleElement *subelement = [element firstChild];
if ([[subelement tagName] isEqualToString:@"font"])
subelement = [subelement firstChild];
tutorial.title = [subelement content];
NSLog(@"title is: %@", [tutorial.title description]);
}
这会产生以下输出:
2013-05-10 19:39:42.027 hpple-test[33881:c07] 有 10773 个节点
2013-05-10 19:39:42.028 hpple-test[33881:c07] 标题是:A
2013-05-10 19:39:46.027 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:46.698 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:47.333 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:47.827 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:48.358 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:49.133 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:49.775 hpple-test[33881:c07] 标题是:Abay,Hiwet B
2013-05-10 19:39:50.326 hpple-test[33881:c07] 标题是:H-Abay
2013-05-10 19:39:50.992 hpple-test[33881:c07] 标题是:773-442-5140
2013-05-10 19:39:51.597 hpple-test[33881:c07] 标题是:(空)
2013-05-10 19:39:52.092 hpple-test[33881:c07] 标题是:控制器
2013-05-10 19:39:52.598 hpple-test[33881:c07] 标题是:E
2013-05-10 19:39:53.149 hpple-test[33881:c07] 标题是:223
2013-05-10 19:39:55.040 hpple-test[33881:c07] 标题是:Abbruscato,Terence
2013-05-10 19:39:55.806 hpple-test[33881:c07] 标题是:T-Abbruscato
2013-05-10 19:39:56.525 hpple-test[33881:c07] 标题是:773-442-5339
...