在限制语义丢失的同时,将简单数据帧保存到 R 中的磁盘进行存储的最佳格式是什么?
我问是因为我正在归档一个数据集。在理想情况下,我的数据格式将具有以下特征:
- 稳定性 - 存储格式将与 R 的未来版本兼容
- 语义兼容性——存储格式将理解 R 的原始数据类型的语义。例如,它将能够以合理的方式存储带有标签的有序因子。
- 开放标准 - 理想情况下,该格式将是一个开放标准,因此其他统计数据包(现在或将来)将能够理解它
我的第一个想法是使用非常稳定的 CSV,但缺乏所需的语义丰富性。另一方面,R 的内置 RData 格式完全捕获了 R 的语义,但似乎可能会在版本之间发生变化(如果我错了,请纠正我)。
是否有另一种格式可以在这三个命令之间找到平衡?