对于数据恢复程序,我需要能够从 NSArchiver 编写的文件中提取值+类型,而无需访问 Apple 的 CF / NS 框架。
OS Xfile
命令报告以下文件:
NeXT/Apple typedstream data, little endian, version 4, system 1000
有没有关于这些文件是如何编码的文档,或者有没有人想出可以解析它们的代码?
这是此类数据的示例(也:可下载):
04 0B 73 74 72 65 61 6D 74 79 70 65 64 81 E8 03 ..streamtyped...
84 01 40 84 84 84 12 4E 53 41 74 74 72 69 62 75 ..@....NSAttribu
74 65 64 53 74 72 69 6E 67 00 84 84 08 4E 53 4F tedString....NSO
62 6A 65 63 74 00 85 92 84 84 84 08 4E 53 53 74 bject.......NSSt
72 69 6E 67 01 94 84 01 2B 06 46 65 73 6B 65 72 ring....+.Fesker
86 84 02 69 49 01 06 92 84 84 84 0C 4E 53 44 69 ...iI.......NSDi
63 74 69 6F 6E 61 72 79 00 94 84 01 69 01 92 84 ctionary....i...
96 96 1D 5F 5F 6B 49 4D 4D 65 73 73 61 67 65 50 ...__kIMMessageP
61 72 74 41 74 74 72 69 62 75 74 65 4E 61 6D 65 artAttributeName
86 92 84 84 84 08 4E 53 4E 75 6D 62 65 72 00 84 ......NSNumber..
84 07 4E 53 56 61 6C 75 65 00 94 84 01 2A 84 99 ..NSValue....*..
99 00 86 86 86 .....
这包含一个 NSAttributedString。我有类似的示例,其中包含 NSMutableAttributedStrings 等,但最终都解析为 NSAttributedStrings,我喜欢为此获取文本。我不关心其余的,但我需要知道它是否有效。
我目前的解决方案是使用 NSUarchiver,假设我总是应该在那里找到一个 NSAttributedString,获取它的第一个元素并读取它的文本,然后从中重新创建一个存档,看看它是否与原始数据相同。如果我收到异常或不同的存档,我认为存档已损坏或无效:
NSData *data = [[NSData alloc] initWithBytesNoCopy:dataPtr length:dataLen freeWhenDone:false];
NSUnarchiver *a = NULL;
// The algorithm simply assumes that the data contains a NSAttributedString, retrieves it,
// and then recreates the NSArchived version from it in order to tell its size.
@try {
a = [[NSUnarchiver alloc] initForReadingWithData:data];
NSAttributedString *s = [a decodeObject];
// re-encode the string item so we can tell its length
NSData *d = [NSArchiver archivedDataWithRootObject:s];
if ([d isEqualTo:[data subdataWithRange:NSMakeRange(0,d.length)]]) {
lenOut = (int) d.length;
okay = true; // -> lenOut is valid, though textOut might still fail, see @catch below
textOut = [s.string cStringUsingEncoding:NSUTF8StringEncoding];
} else {
// oops, we don't get back what we had as input, so let's better not consider this valid
}
} @catch (NSException *e) {
// data is invalid
}
但是,上面的代码有几个问题:
- 它不是 x 平台。我也需要这个在 Windows 上工作。
- 损坏数据的一些示例会导致写入 stderr 或 syslog 的不需要的错误消息(不确定是哪个),例如:(
*** mmap(size=18446744071608111104) failed (error code=12) *** error: can't allocate region *** set a breakpoint in malloc_error_break to debug
我提交了一份关于此的错误报告,遗憾的是,该报告已关闭为“无法修复”)。 - 没有任何东西可以保证 NSUNarchiver 代码是 100% 防崩溃的。malloc 错误就是一个例子。在某些情况下,我可能会遇到总线错误,那将是致命的。如果我有用于解析的自定义代码,我可以自己处理(并修复我遇到的任何崩溃)。(更新:我刚刚发现了一些无效数据,它们确实使用 SIGSEGV 使 NSUNarchiver 崩溃。)
因此,我需要自定义代码来解码这些类型的档案。我看过一些,但无法理解它使用的代码。显然,有长度字段和类型字段,显然类型在 0x81 到 0x86 的范围内。此外,前 16 个字节是标头,包括偏移 14-15 处的系统代码 (0x03E8 = 1000)。
我还想知道源代码是否在一些旧的 NeXT 源或曾经存在的 Windows 版本中可用,但我在哪里可以找到呢?(注意:我被定向到 GNUstep 源代码(“core.20131003.tar.bz2”),我在其中找到了它的 NSUarchiver 源代码,但是该代码显然是 1998 年的,它使用自己的编码,不理解这一点“流式“编码。)