我得到一个作为 NSData 的 html 文件,需要对其进行解析以提取一些信息。我的方法是使用 UTF8 编码将其转换为 NSString(html 有非英文字符,例如俄语) - 它失败了。我使用了类似的东西:
NSString *respData = [NSString stringWithUTF8String:[theData bytes]];
但它返回零。
唯一真正起作用的是
[NSString stringWithCString:[theData bytes] length:[theData length]];
但是当它遇到例如俄语字符时,它会返回jibrish。
然后我的下一个方法是解析数据的字节数组,提取我需要的字节并以某种方式将它们转换为 NSString。我尝试过这样的事情:
-(NSString *)UTF8StringFromData:(NSData *)theData{
Byte *arr = [theData bytes];
NSUInteger begin1 = [self findIndexOf:@"<li>" bArr:arr size:[theData length]]+4;
NSUInteger end1 = [self findIndexOf:@"</li></ol>" bArr:arr size:[theData length]];
Byte *arr1 = (Byte *)malloc(sizeof(Byte)*((end1-begin1+1)));
int j = 0;
for (int i = begin1; i < end1; i++){
arr1[j] = arr[i];
j++;
}
arr1[j]='\0';
NSData *temp = [NSData dataWithBytes:arr1 length:j];
return [[NSString alloc] initWithData:temp encoding:NSUTF8StringEncoding];
}