将 HTML 解析为字符串时有一点问题。我有一个大字符串,我需要删除“脚本”标签之间的字符。像这样的东西:
<script...>Some text here</script>
所以我需要删除“这里的一些文字”。我认为使用 NSRegularExpression 会很棒。有谁能够帮助我 ?非常感谢。
将 HTML 解析为字符串时有一点问题。我有一个大字符串,我需要删除“脚本”标签之间的字符。像这样的东西:
<script...>Some text here</script>
所以我需要删除“这里的一些文字”。我认为使用 NSRegularExpression 会很棒。有谁能够帮助我 ?非常感谢。
虽然通常会建议您不要使用正则表达式解析 HTML(请参阅我一直以来最喜欢的 SO 答案),但您可以使用以下内容来近似它:
NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"<script.*?>(.*?)</script>"
options:NSRegularExpressionCaseInsensitive | NSRegularExpressionDotMatchesLineSeparators
error:&error];
[regex enumerateMatchesInString:string
options:0
range:NSMakeRange(0, [string length])
usingBlock:^(NSTextCheckingResult *result, NSMatchingFlags flags, BOOL *stop) {
NSLog(@"%@", [string substringWithRange:[result rangeAtIndex:1]]);
}];