我正在解析一些 HTML,我需要获取<body />
. 我是这样做的:
TFHpple *doc = [[TFHpple alloc] initWithHTMLData:[NSData dataWithContentsOfFile:sectionFilePath]];
TFHppleElement *body = [doc searchWithXPathQuery:@"//body"][0];
NSString *bodyHTML = body.raw;
但是,这会返回:
<body>stuff inside body</body>
而不仅仅是:
stuff inside body
问题:有什么方法可以获取元素的纯内部 HTML,不包括它自己的标签?
我想出了这个方法,但我觉得我在这里重新发明了轮子。这种方法也很慢。
TFHppleElement *child;
for(int i = 0; i<body.children.count; i++){
child = (TFHppleElement*)body.children[i];
if(child.raw != nil) [bodyHTML appendString:child.raw];
else if(child.content != nil) [bodyHTML appendString:child.content];
}