0

我正在尝试使用 NSXMLParser 解析看起来像这样的 XML 文件:

<?xml version="1.0" encoding="us-ascii"?>
<teams>
    <team id = "A1">
        <player1>John</player1>
        <player2>José</player2>
    </team>
    ...
</teams>

我使用以下代码:

NSString *urlString = [NSString stringWithFormat:@"http://www....abc.php?category=%@&poule=%c", @"S", 'B'];  // Obviously, this contains an actual web address
NSURL *url = [NSURL URLWithString:urlString];
NSData *xml = [[NSData alloc] initWithContentsOfURL:url];   // <==
NSXMLParser *xmlParserObject = [[NSXMLParser alloc]initWithData:xml];
[xmlParserObject setDelegate:self];
[xmlParserObject parse];

我实现了 didStartElement、foundCharacters、didEndElement 和 parserErrorOccurred 委托函数。

这一切都很顺利,直到遇到“特殊”字符,例如 é。委托方法parserErrorOccurred报如下错误:

parser error: Error Domain=NSXMLParserErrorDomain Code=1544 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 1544.)"
parser error: Error Domain=NSXMLParserErrorDomain Code=5 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 5.)"

然后我将标有“<==”的部分替换为以下内容:

NSError *error;
NSData *xml = [NSString stringWithContentsOfURL:url encoding:NSUTF8StringEncoding error:&error];
if (xml == nil) {
    NSLog(@"*** Fatal error: %@\nuserInfo:%@", error, [error userInfo]);
}

除上述错误外,还出现以下错误:

 *** Fatal error: Error Domain=NSCocoaErrorDomain Code=261 "The operation couldn’t be completed. (Cocoa error 261.)" UserInfo=0x8158d90 {NSURL=http://www....abc.php?category=S&poule=B, NSStringEncoding=4}
userInfo:{
    NSStringEncoding = 4;
    NSURL = "http://www....abc.php?category=S&poule=B";
}

我还尝试将 NSUTF8StringEncoding 替换为任何其他编码器,例如 NSISOLatin1StringEncoding、NSUTF16StringEncoding、NSASCIIStringEncoding、NSUnicodeStringEncoding 等。这导致了以下错误:

 -[__NSCFString bytes]: unrecognized selector sent to instance 0x6e4cbc0
 *** Terminating app due to uncaught exception 'NSInvalidArgumentException', reason: '-[__NSCFString bytes]: unrecognized selector sent to instance 0x6e4cbc0'
*** First throw call stack:
(0x12d0022 0x1781cd6 0x12d1cbd 0x1236ed0 0x1236cb2 0xce5f51 0xb447 0xaa89 0x1f2e330 0x1f2f439 0x908b9b24 0x908bb6fe)
terminate called throwing an exception(lldb) 

我无法控制 XML 的内容,但如果它确实包含不正确的信息,那么也许我可以与网站管理员交谈。

我可以将 é 字符显示为 'e' 或 '?' 如果这就是它所需要的。

非常感谢有关导致此错误的原因以及如何纠正或绕过它的任何建议。

发送!

--国标

4

2 回答 2

0

我找到了解决这个问题的方法(不是解决方案)。为了从 NSURL 到 NSData,我使用了以下代码:

        NSError *error;
        NSString *xmlText = [NSString stringWithContentsOfURL:url encoding:NSASCIIStringEncoding error:&error];
        xmlText = [xmlText stringByReplacingOccurrencesOfString:@"é" withString:@"e"];
        NSData *xml = [xmlText dataUsingEncoding:NSASCIIStringEncoding];

所以基本上,我

  • 将 NSURL 转换为 NSString
  • 通过替换“特殊”字符来编辑该字符串
  • 使用编辑后的字符串创建 NSData

我还发现我必须使用 NSASCIIStringEncoding 而不是 NSUTF8StringEncoding(这是 XML 指定的,但之前失败了)。

无论如何,仍然欢迎提出真正解决问题的建议,但这种绕过方式暂时适用于我......

于 2012-06-27T16:02:03.960 回答
0

如果 utf-8 字符无效,最好先“清理”从源接收的数据,然后再将其处理给 NSXMLParser。正如在处理 NSXMLParser 时经常建议的那样,将数据转换为 ascii 并不总是一个好主意,例如当您的源代码包含西里尔字符时。

在 Swift 中,它可以这样完成:

var buffer = data // malformed UTF-8
buffer.append(0 as UInt16)
let cleanBuffer = buffer.withUnsafeBytes { (p: UnsafePointer<CChar>) in String(cString: p) }
let cleanString = cleanBuffer.replacingOccurrences(of: "\u{FFFD}", with: String())
let cleanData = clean.data(using: String.Encoding.utf8) {
   self.parser = XMLParser(data: cleanData) // Assuming a 'parser' variable is already present
}

基于清理格式错误的 UTF8 字符串

于 2018-04-01T12:17:19.973 回答