8

对于数据恢复程序,我需要能够从 NSArchiver 编写的文件中提取值+类型,而无需访问 Apple 的 CF / NS 框架。

OS Xfile命令报告以下文件:

NeXT/Apple typedstream data, little endian, version 4, system 1000

有没有关于这些文件是如何编码的文档,或者有没有人想出可以解析它们的代码?

这是此类数据的示例(也:可下载):

04 0B 73 74 72 65 61 6D 74 79 70 65 64 81 E8 03  ..streamtyped...
84 01 40 84 84 84 12 4E 53 41 74 74 72 69 62 75  ..@....NSAttribu
74 65 64 53 74 72 69 6E 67 00 84 84 08 4E 53 4F  tedString....NSO
62 6A 65 63 74 00 85 92 84 84 84 08 4E 53 53 74  bject.......NSSt
72 69 6E 67 01 94 84 01 2B 06 46 65 73 6B 65 72  ring....+.Fesker
86 84 02 69 49 01 06 92 84 84 84 0C 4E 53 44 69  ...iI.......NSDi
63 74 69 6F 6E 61 72 79 00 94 84 01 69 01 92 84  ctionary....i...
96 96 1D 5F 5F 6B 49 4D 4D 65 73 73 61 67 65 50  ...__kIMMessageP
61 72 74 41 74 74 72 69 62 75 74 65 4E 61 6D 65  artAttributeName
86 92 84 84 84 08 4E 53 4E 75 6D 62 65 72 00 84  ......NSNumber..
84 07 4E 53 56 61 6C 75 65 00 94 84 01 2A 84 99  ..NSValue....*..
99 00 86 86 86                                   .....

这包含一个 NSAttributedString。我有类似的示例,其中包含 NSMutableAttributedStrings 等,但最终都解析为 NSAttributedStrings,我喜欢为此获取文本。我不关心其余的,但我需要知道它是否有效。

我目前的解决方案是使用 NSUarchiver,假设我总是应该在那里找到一个 NSAttributedString,获取它的第一个元素并读取它的文本,然后从中重新创建一个存档,看看它是否与原始数据相同。如果我收到异常或不同的存档,我认为存档已损坏或无效:

NSData *data = [[NSData alloc] initWithBytesNoCopy:dataPtr length:dataLen freeWhenDone:false];
NSUnarchiver *a = NULL;

// The algorithm simply assumes that the data contains a NSAttributedString, retrieves it,
// and then recreates the NSArchived version from it in order to tell its size.
@try {
    a = [[NSUnarchiver alloc] initForReadingWithData:data];
    NSAttributedString *s = [a decodeObject];

    // re-encode the string item so we can tell its length
    NSData *d = [NSArchiver archivedDataWithRootObject:s];
    if ([d isEqualTo:[data subdataWithRange:NSMakeRange(0,d.length)]]) {
        lenOut = (int) d.length;
        okay = true; // -> lenOut is valid, though textOut might still fail, see @catch below
        textOut = [s.string cStringUsingEncoding:NSUTF8StringEncoding];
    } else {
        // oops, we don't get back what we had as input, so let's better not consider this valid
    }
} @catch (NSException *e) {
    // data is invalid
}

但是,上面的代码有几个问题:

  1. 它不是 x 平台。我也需要这个在 Windows 上工作。
  2. 损坏数据的一些示例会导致写入 stderr 或 syslog 的不需要的错误消息(不确定是哪个),例如:(*** mmap(size=18446744071608111104) failed (error code=12) *** error: can't allocate region *** set a breakpoint in malloc_error_break to debug我提交了一份关于此的错误报告,遗憾的是,该报告已关闭为“无法修复”)。
  3. 没有任何东西可以保证 NSUNarchiver 代码是 100% 防崩溃的。malloc 错误就是一个例子。在某些情况下,我可能会遇到总线错误,那将是致命的。如果我有用于解析的自定义代码,我可以自己处理(并修复我遇到的任何崩溃)。(更新:我刚刚发现了一些无效数据,它们确实使用 SIGSEGV 使 NSUNarchiver 崩溃。)

因此,我需要自定义代码来解码这些类型的档案。我看过一些,但无法理解它使用的代码。显然,有长度字段和类型字段,显然类型在 0x81 到 0x86 的范围内。此外,前 16 个字节是标头,包括偏移 14-15 处的系统代码 (0x03E8 = 1000)。

我还想知道源代码是否在一些旧的 NeXT 源或曾经存在的 Windows 版本中可用,但我在哪里可以找到呢?(注意:我被定向到 GNUstep 源代码(“core.20131003.tar.bz2”),我在其中找到了它的 NSUarchiver 源代码,但是该代码显然是 1998 年的,它使用自己的编码,不理解这一点“流式“编码。

4

6 回答 6

6

虽然我不知道该格式的任何文档,但您可以通过查看较旧的 Darwin(或者可能是 OpenStep)版本的公共源代码来找到您正在寻找的信息。

例如,查看旧 darwin 发行版镜像中可用typedstream文件typedstream.m中的实现。objc-1.tar.gz

此源代码应该能够读/写typedstream. 请务必在使用时确认 Apple 的许可。

于 2013-10-03T19:44:46.303 回答
3

这里的部分问题是 Cocoa/NeXTSTEP/OPENSTEP 中的每个类都知道如何归档自己。在每个类中都有一个 initWithCoder:/encodeWithCoder: 方法,其中有一个用于 typedstream 的部分和另一个用于键控存档的部分。键控档案更现代,通常表示为 XML plist。这些可以以二进制形式编码,但是,毫无疑问,这种二进制形式与 typedstream 存档不同。此外,它们是键控的,因此可以轻松提取单个数据,而无需读取之前的所有数据。Typedstream 档案不能以这种方式工作。它们是基于顺序的,这意味着每个对象中的每个元素都是一个接一个地编写的。首先是类名,然后是版本,然后是每条数据。

当您归档对象图的根对象时,它会调用该对象的 encodeWithCoder: 方法,该方法又会调用它包含的每个对象的 encodeWithCoder: 方法,依此类推,直到整个对象图被归档。当使用键控存档(NSKeyedArchiver)完成此操作时,存档会被适当地构建和键控。当使用类型化的流存档(NSArchiver)完成时,会发生相同的递归,但每次对对象进行编码时,它只会按照开发人员当时认为合适的任何顺序将每个元素转储到存档中。

我希望这个解释能澄清一点。你前面有一条艰难的道路。在 GNUstep 中避免这样做是有原因的。如果我们有,我们仍然会试图弄清楚。

于 2013-10-04T05:02:14.613 回答
0

看看 Cocotron 的 and 的开源NSArchiver实现NSUnarchiver

https://code.google.com/p/cocotron/source/browse/Foundation/NSArchiver.m https://code.google.com/p/cocotron/source/browse/Foundation/NSUnarchiver.m

于 2013-10-03T17:16:58.370 回答
0

Frank IllenbergerMEUnarchiver根据 1999 年的 typedstream.m 源代码编写了一个 NSUnarchiver 替代品:https ://github.com/depth42/MEUnarchiver

它已被扩展以支持原始源代码不知道的新类型。它仍然依赖于 ObjC 运行时为所有标准类型(如 NSString 等)提供 NSCoding 解码器实现,但除此之外它非常独立,并且允许我防止在传递损坏的数据时使用 Apple 的 NSUarchiver 代码发生崩溃。

于 2015-03-13T17:48:40.723 回答
0

首先,请参阅Is there a way to read in files in TypedStream 格式以获得一些有趣的信息。

很可能,可以使用该plutil工具将格式转换为更具可读性的格式。此工具也可用于 Windows(它附带 iTunes for Windows)。虽然不确定它的许可证。

有问题的部分是文件包含转换为二进制的对象实例这一事实。了解文件格式是不够的,有必要了解每种类型的存储方式。

于 2013-10-03T19:47:48.510 回答
0

它似乎是 GNU Objective-C 运行时的一部分,即使它不完全是运行时的东西(参见讨论: http: //gcc.gnu.org/ml/gcc-patches/2010-09/msg00495.html

这个文件可以实现这些东西: https ://github.com/gnustep/libobjc/blob/master/archive.c

于 2013-10-03T19:33:03.743 回答