- XDF 文件是一种压缩的二进制文件格式,具有用户可选择的压缩级别,可以在此处找到一些快速的事实:https: //support.microsoft.com/en-us/help/3104260/qa-what-is-the- .xdf-file-format XDF 文件有两种形式,独立和复合。对于独立 XDF 文件,您将看到存储在磁盘上的单个文件,扩展名为 .xdf。对于 Composite,XDF 文件由一个目录表示,其中包含元数据和数据子目录。此外,对于复合、元数据和数据文件,目录中的文件被拆分并单独压缩为 XDF 部分文件。
- 它是 Microsoft R Server 内部的专有实现,我可以扩展这个答案,但我需要细化这个问题,“这种类型的文件如何工作?”
- XDF 文件存储在磁盘上,不位于内存中。Microsoft R Server 通过调用 RxXdfData() 或 rxImport() 将读取 XDF 文件并将其解压缩,然后将其作为数据帧插入内存。许多 Microsoft R“rx”函数可以将 XDF 直接作为数据源或接收器的路径,并将根据需要管理读取段到内存中。
- 使用 XDF 作为数据源/接收器的优点是您不需要将整个文件缓冲到内存中以便 Microsoft R Server 使用它。它允许部分读取和写入,以及通过压缩对磁盘空间进行其他优化。由于元数据用于索引 XDF,因此它将比从平面文件中读取/写入更快。缺点主要是性能,内存中的数据(data.frames)在所有情况下都比磁盘上的数据更快。
注意:与所有文件一样,底层操作系统控制文件何时从内存写入磁盘。出于您的问题的目的,可以假设 XDF 文件作为标准文件驻留在磁盘上。