6

简而言之:我需要在 Github 上托管的文件中获取上次更改的日期。

长篇大论:鉴于在 Github 中我有一个文件(一个 R 工作区)偶尔会更新,我想在 R 中创建一个函数来检查我的本地文件是否比 repo 中的文件旧(如果你'很好奇,我的动机在这篇文章的末尾暴露)。这是我正在谈论的文件。

原则上它应该有点容易,因为每个文件都有一个与之关联的历史页面,但我的知识太少了,不知道该怎么做。此外,这个 Q似乎暗示了某种使用 php 做我想做的事情的方式,但这对我来说真的是未知领域,所以我不知道它是否能以任何方式提供帮助。

因此,正如我在这篇文章的简短版本中所说,我需要找到一种方法来检索该文件的最后一次提交的日期。之后我可以找到一些方法将其与本地文件的提交日期进行比较。

提前致谢,胡安

动机:我正在学习 R 基础知识的在线课程,该课程使用一个系统来自我检查练习的解决方案是否正确(即:学生可以立即检查他们的结果)。这个系统使用一个文件,它的功能和数据会定期更新,因为我经常发现错误和新问题。所以我的目标是有一个功能来告诉学生是否有更新的文件可用。找到一种下载它并替换旧版本的方法也很巧妙,但现在这是次要的。

4

3 回答 3

3

问题是要保持下载的 git-time。下面的解决方案将文件时间设置为每次下载后的 Git 日期以进行下一次检查。

library(RCurl)
library(rjson)
destination = "datos" # assume current directory
repo = "https://api.github.com/repos/jumanbar/Curso-R/"
path = "ejercicios-de-programacion/rep-3/datos"
myopts = curlOptions(useragent="whatever",ssl.verifypeer=FALSE)

d = fromJSON(getURL(paste0(repo,"commits?path=",path),
                useragent="whatever",ssl.verifypeer=FALSE))[[1]]
gitDate  = as.POSIXct(d$commit$author$date)
MustDownload = !file.exists(destination) |  file.info(destination)$mtime > gitDate
if (MustDownload){
  url = d$url
  commit = fromJSON(getURL(url, .opts=myopts))
  files = unlist(lapply(commit$files,"[[","filename"))
  rawfile = commit$files[[which(files==path)]]$raw_url
  download.file(rawfile,destination,quiet=TRUE)
  Sys.setFileTime(destination,gitDate)
  print("File was downloaded")
}

从 R 看来,useragent 和 ssl.verifypeer 是必需的;无需从命令行即可工作。如果你有安全意识,有关于该主题的文档随处可见,但我采取了简单的方法来提交。

于 2013-05-16T09:18:48.897 回答
2

看来您需要 github 存储库的本地克隆。暂时忘记 R 的语言细节(我不知道 R),在 git 中你可以通过git log. 在git log帮助文件 ( git help log) 的占位符部分下:

%cd: committer date
%cD: committer date, RFC2822 style
%cr: committer date, relative
%ct: committer date, UNIX timestamp
%ci: committer date, ISO 8601 format

git log您可以使用以下命令从项目根目录开始检索文件最近提交的 UNIX 时间戳(自 1970 年 1 月 1 日开始的秒数 - 非常容易比较) :

git log --format=%ct -1 -- ejercicios-de-programacion/rep-3/datos

这将返回一个数字,例如 1368691710,但您也可以使用列出的其他格式。

现在你只需要找到一种方法来从 R 中进行这个系统调用,并将你的项目根目录作为工作目录。这篇 SO 帖子可能会有所帮助(但同样,我不知道)。

于 2013-05-16T08:21:45.687 回答
0

也许您可以将“git status”命令(它告诉您是否有新的提交)与 cronjobs 结合使用。但是你需要一个本地克隆。而且我从未尝试在 cronjob 中使用命令的输出。

于 2013-05-16T12:16:21.800 回答