我正在尝试使用stringWithContentsOfURL:encoding:error:
using获取网页的内容NSUTF8StringEncoding
。问题是网页的 utf-8 字节无效,因此该方法返回 nil。我将如何处理无效的 utf-8 字节?
我尝试过的事情。
- 尝试使用
NSString.h
和中的每个编码CFStringEncodingExt.h
使用 NSISOLatin1StringEncoding,然后删除无效字节然后执行
[NSString stringWithCString:[str cStringUsingEncoding:NSISOLatin1StringEncoding] encoding:NSUTF8StringEncoding];
stringWithContentsOfURL:usedEncoding:error:
这导致日文 Unicode 字符乱码。
我正在使用的网页http://vgmdb.net/album/32234
使用iconv
无效字符似乎EF BF BD
是十六进制
`iconv -c -f UTF8 -t UTF8 32234.html`