我有一个类似这样的html内容。
<body>
<div>
WINDOW<br/>
DOOR<br/>
</div>
</body>
我想提取标签中的文本内容。div
对于这个示例,我想获取 text WINDOW\nDOOR
。
所以我在下面写了代码。
NSString *html = ...;
TFHpple *parser = [[TFHpple alloc]initWithHTMLData:[html dataUsingEncoding:NSUTF8StringEncoding]];
TFHppleElement *div = [parser searchWithXPathQuery:@"//div"][0];
NSString *text = [div text];
它不像我预期的那样工作。text
上面代码的结果WINDOW
只是。DOOR
反正失踪了。
然后我挣扎了很多,写了更多的代码。
NSString *html = ...;
TFHpple *parser = [[TFHpple alloc]initWithHTMLData:[html dataUsingEncoding:NSUTF8StringEncoding]];
TFHppleElement *div = [parser searchWithXPathQuery:@"//div"][0];
NSString *text = [div raw];
text = [self stringByStrippingHTML:text];
我得到了原始的 html 内容,然后剥离了所有的 html 标签以获得我预期的结果。但这种方法似乎有点难看。
所以,我的问题是,是否存在一种方法来获取 html 标记中的所有文本内容?
谢谢你的帮助。