当我用 NSXMLParser 解析一个 html 文件时。我无法避免 html 文件中的空格。例如
<html> <body><p>sample text. This is sample text </p></body></html>
在找到的字符函数中,我也得到了空格。我不想要 html 标签中的空格。但我想要 p 标签中的空格和换行符(还有 h1、div 等)。任何解决方案。
当我用 NSXMLParser 解析一个 html 文件时。我无法避免 html 文件中的空格。例如
<html> <body><p>sample text. This is sample text </p></body></html>
在找到的字符函数中,我也得到了空格。我不想要 html 标签中的空格。但我想要 p 标签中的空格和换行符(还有 h1、div 等)。任何解决方案。
如果 HTML 标记中没有您需要的有用信息,则在解析时忽略它。您可以简单地<p>,<div>
单独解析标签,这将自行删除空格。
例如
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName
namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qualifiedName
attributes:(NSDictionary *)attributeDict {
if([elementName isEqualToString:@"HTML"])
{
NSLog(@"ignore");
}