我正在创建自己的 R 包,我想知道可以使用哪些方法将(时间序列)数据集添加到我的包中。以下是具体情况:
我创建了一个名为data的包子目录,我知道这是我应该保存要添加到包中的数据集的位置。我也知道包含数据的文件可能是 . rda、.txt或.csv文件。
我要添加到包中的每个数据系列都包含一列数字(例如,340 或 4.5 的形式),并且每个数据系列的长度不同。
到目前为止,我已将所有数据集保存到一个.txt文件中。我还使用data()函数成功加载了数据。然而问题没有解决。
问题在于,除了长度最大的系列之外,每个系列的数据都作为一个因素加载。作为因子加载的系列包含缺失值(形式为“.”)。我必须添加这些缺失值以使每列数据的长度相同。我尝试将数据保存为不相等的列,但在调用data()后收到错误消息。
添加缺失值以加载数据的结果是,一旦加载数据,我需要删除 NA 以便继续分析数据!所以,这显然不是一个好的做事方式。
理想情况下(我想),我希望将数据加载为数字向量或列表。这样,我不需要将 NA 附加到每个系列的末尾。
我该如何解决这个问题?我应该将所有数据保存到一个文件中吗?如果是这样,我应该以什么格式进行?也许我应该将数据集保存到多个文件中?再次,以哪种格式?这样做的最佳实用方法是什么?任何提示将不胜感激。