假设我有一个 R 对象列表,它们本身就是列表。每个列表都有一个定义的结构:数据、适合数据的模型和一些用于识别数据的属性。一个例子是特定国家某些经济指标的时间序列。所以我的列表对象有以下元素:
data
- 经济指标的历史时间序列
country
- 国家名称,例如美国
name
- 指标名称,例如 GDP
model
- 以合适的格式找到的 ARIMA 订单auto.arima
,这又可能是一个列表。
这只是一个例子。正如我所说,假设我有许多这样的对象组合成一个列表。我想把它保存成一些合适的格式。显而易见的解决方案是简单地使用save
,但这对于大量对象来说不能很好地扩展。例如,如果我只想检查对象的子集,则需要将所有对象加载到内存中。
如果我的数据是一个,data.frame
我可以将它保存到数据库中。如果我想处理特定的数据子集,我会使用 SELECT 并依靠数据库来提供所需的子集。SQLite 在这方面为我提供了很好的帮助。是否可以使用 MongoDB 等花哨的数据库为我描述的列表对象复制这个?或者我应该简单地考虑如何将我的列表转换为几个相关的表?
我这样做的动机是能够轻松地生成有关拟合模型的各种报告。我可以编写一堆函数来生成给定对象的一些报告,然后只lapply
在我的对象列表中使用。理想情况下,我想并行化这个过程,但这是另一个问题。