是否有人对与自定义报告编写相关的数据分析工作流程有任何智慧?用例基本上是这样的:
客户委托制作一份使用数据分析的报告,例如一个水域的人口估计和相关地图。
分析人员下载一些数据,整理数据并保存结果(例如,为每单位人口添加一列,或根据地区边界对数据进行子集化)。
分析师分析在 (2) 中创建的数据,接近她的目标,但认为需要更多数据,因此返回 (1)。
冲洗重复,直到表格和图形符合 QA/QC 并满足客户。
编写包含表格和图形的报告。
明年,快乐的客户回来并想要更新。这应该像通过新下载更新上游数据一样简单(例如,从去年获得建筑许可),然后按“重新计算”按钮,除非规格发生变化。
目前,我只是启动一个目录,并尽我所能将其临时化。我想要一种更系统的方法,所以我希望有人能解决这个问题……我混合使用了电子表格、SQL、ARCGIS、R 和 Unix 工具。
谢谢!
PS:
.RData
下面是一个基本的 Makefile,它检查各种中间数据集(带后缀)和脚本(后缀)的依赖关系.R
。Make 使用时间戳来检查依赖关系,所以如果你touch ss07por.csv
,它会看到这个文件比所有依赖它的文件/目标都新,并执行给定的脚本以相应地更新它们。这仍然是一项正在进行的工作,包括一个放入 SQL 数据库的步骤,以及一个像 sweave 这样的模板语言的步骤。请注意,Make 在其语法中依赖于制表符,因此在剪切和粘贴之前请阅读手册。享受并提供反馈!
http://www.gnu.org/software/make/manual/html_node/index.html#Top
R=/home/wsprague/R-2.9.2/bin/R persondata.RData : ImportData.R ../../DATA/ss07por.csv Functions.R $R --slave -f ImportData.R persondata.Munged.RData : MungeData.R persondata.RData Functions.R $R --slave -f MungeData.R report.txt:TabulateAndGraph.R persondata.Munged.RData Functions.R $R --slave -f TabulateAndGraph.R > report.txt