当新数据进入时,我正在尝试使用该xlsx
包来帮助清理复杂的数据集。我的目标是一个如下所示的工作流:
- 将数据导入R,做一些编码数据清理。
- 将数据写入 xls 文件,将其保存到保管箱文件夹
- 非 R 识字的同事(和我自己)然后可以进行手动数据清理
- 随着更多数据的输入,我重复第 1 步,然后将其附加到现有的 XLS 文件中,保留突出显示、注释或粗体等格式。
最后,我很好奇我希望这是否适用于 LibreOffice(在我使用的 Linux 中)和 Excel(在同事使用的 Windows 中)。
目前,我很难找到一种将数据附加到现有电子表格而不完全重写它(从而丢失任何格式)的方法。
这是我希望能够使用预加载iris
数据集的示例:
#Import data, do some coded cleaning:
data = iris[1:10,]
data$Sepal.Ratio = with(data, Sepal.Length/Sepal.Width)
data$Sepal.Length = NULL
data$Sepal.Width = NULL
data$Species = as.character(data$Species)
#Write to excel...
write.xlsx(data,file="ss.xls")
#Manually make some changes
system('soffice /path/to/ss.xls')
(见截图)
#Load and clean more data...
data = iris[11:20,]
data$Sepal.Ratio = with(data, Sepal.Length/Sepal.Width)
data$Sepal.Length = NULL
data$Sepal.Width = NULL
data$Species = as.character(data$Species)
#Append it to the existing spreadsheet, while preserving previous formatting
???
该append=TRUE
选项在这里没有太大帮助,因为它旨在简单地将工作表添加到工作簿。
或者,是否可以将电子表格的格式读入某种 R 对象,然后将其应用于重写的文件,执行如下操作?
olddat = read.xls('/path/to/ss.xls')
formatting <- someFunctionToExtractFormatting('/path/to/ss.xls')
newdata = rbind(olddata,data)
write.xlsx(newdata,file="ss.xls", FORMATTING=formatting)
有一些类似的命令允许我从 R 定义格式,但我没有找到可以读取然后重写格式的命令