1

我目前正在编写一些代码

  1. 通过 API 连接到服务器并获取一堆数据,
  2. 按案例 ID 组织该数据,
  3. 生成个案报告,
  4. 每个案例创建一个 pdf(案例概述)文件,最后
  5. 将这些文件推送回服务器。

我对 R 很熟悉,对 pdflatex 也有些熟悉。我刚刚发现了 bash 脚本——因为我已经开始在 Ubuntu 环境中工作——我现在开始意识到哪些程序最适合这项工作并不简单。

我目前的计划是在 R 中使用 RCrul 获取数据,在 R 中组织数据并生成一堆 .tex 文件。以后我打算使用 pdflatex 创建 pdf 文件,最后再次使用 R 将新创建的 pdf 文件推送回服务器。我已经开始写一个小的 bash 脚本,

for f in *Rnw
do
# do something on ${f%%.*}
Rscript -e “source("fetch.data.and.generate.Rnw.R")”             # 1 through 3 
Rscript -e "library(knitr); knit('${f%%.*}.Rnw')"                # 4
pdflatex "${f%%.*}.tex"                                          # 4 continued
rm "${f%%.*}.tex" "${f%%.*}.aux" "${f%%.*}.log" "${f%%.*}.out"   # cleanup after 4
Rscript -e “source("push.pdf.R")”                                # 5
done

我希望有人能告诉我什么软件最适合工作的各个部分,什么软件能给我最好的表现。

数据不是那么广泛,我将处理大约 500 到 2000 个案例和大约 20 到 30 个变量。

4

1 回答 1

1

@flodel 和 @shellter 提出了很好的观点。我只会补充一点,如果您决定在解决方案中继续使用 bash,您可能会发现计算一次文件名变量然后在其他地方使用它更容易:

for f in *Rnw; do
    stem="${f%%.*}"
    Rscript commands with $stem
    pdflatex command involving $stem
    Rscript commands for pushing $stem.pdf
    rm $stem.*
end
于 2012-12-07T19:00:44.013 回答