iphone - iOS - 从网站加载文本在文本视图中有 HTML 标签。需要删除它们

Question

在我的应用程序中，我有一个带有详细视图的表格视图。详细视图从HERE加载博客文章，详细视图将显示该文章中的文本。我几乎让它工作了，但我仍然需要弄清楚如何修复文本（下面的示例）。这是我必须在详细视图中从网站中提取文本的代码：

-(void)viewDidLoad {
                                          //self.url is from the table view where the link to the website is
    NSURL *myURL = [NSURL URLWithString: [self.url stringByAddingPercentEscapesUsingEncoding: NSUTF8StringEncoding]];
    NSURLRequest *request = [NSURLRequest requestWithURL:myURL]; 
    [self.webView loadRequest:request];

    timer = [NSTimer scheduledTimerWithTimeInterval:0.01 target:self selector:@selector(LoadText) userInfo:nil repeats:YES];

}

-(void)webViewDidLoadText {

    NSString *textForBlog = [self.webView stringByEvaluatingJavaScriptFromString:@"document.getElementsByClassName('paragraph')[0].innerHTML;"];

    self.textView.text = textForBlog;

}

在此处输入图像描述

score 1 · Accepted Answer

以您的代码为例，这就是您实现它的方式：

-(void)webViewDidLoadText {

    NSString *textForBlog = [self.webView stringByEvaluatingJavaScriptFromString:@"document.getElementsByClassName('paragraph')[0].innerHTML;"];

    // Add this step for stripping the HTML from the text you received
    NSString *strippedTextForBlog = [self stringByStrippingHTMLFromString:textForBlog];

    self.textView.text = strippedTextForBlog;

}

// Taken from: http://stackoverflow.com/questions/6170531/strip-out-html-tags-etc-from-nsstring/6171866#6171866
- (NSString *)stringByStrippingHTMLFromString:(NSString *)str
{
    NSMutableString *html = [NSMutableString stringWithCapacity:[str length]];

    NSScanner *scanner = [NSScanner scannerWithString:str];
    scanner.charactersToBeSkipped = NULL;
    NSString *tempText = nil;

    while (![scanner isAtEnd])
    {
        [scanner scanUpToString:@"<" intoString:&tempText];

        if (tempText != nil)
            [html appendString:tempText];

        [scanner scanUpToString:@">" intoString:NULL];

        if (![scanner isAtEnd])
            [scanner setScanLocation:[scanner scanLocation] + 1];

        tempText = nil;
    }

    return html;
}

iphone - iOS - 从网站加载文本在文本视图中有 HTML 标签。需要删除它们

1 回答 1

Related

Reference