1

我正在做一个项目,我需要将git log –pGitHub 项目中的信息放入数据库中。首先,我将其git log –p放入.txt文件中,并使用 Python 对其进行扫描。(Python对我来说有点新)。

a 的结构git log –p如下所示:

commit 5f0883381054b796b643dcff974435633eed8a79
Merge: 4e1d5f7 8ffg9do
Author: name <email>
Date:   date of commit

    "comment of the commit"

diff --…
index …
--- …
+++ …
@@ …
-…
+…
 …

diff --…
index …
--- …
+++ …
@@ …

commit 737044517f403c1080886a674845fad9c42d6bc0
Author: name <email>
Date:   date of commit

   completion: …

   Signed-off-by: name <email>
   Signed-off-by: name <email>

commit 6bf931a54fd66826f28d2808b7ad822024764d41
Merge: 727a46b 3646b1a
Author: name <email>
Date:   date of commit

   Merge branch …

   * …:
     completion: …
     completion: …
     completion: …

commit c3c327deeaf018e727a27f5ae88e140ff7a48595
Author: name <email>
Date:   date

目前,我很容易使用正则表达式获得提交、合并、作者、日期行。

    for line in source:

        commit = re.findall('^commit.{41}',line)
        merge = re.findall('^Merge:.*',line)
        author = re.findall('^Author:.*',line)
        date = re.findall('^Date:.*',line)
        signed = re.findall('Signed-off-by:.*', line)
        diffBlock = re.findall("^['diff''index'+-@].*", line) # bad way, I miss few lines


        for commitLine in commit:
            print (commitLine)
            #post into DB

        for mergeLine in merge:
            print (mergeLine)
            #post into DB
        .
        .
        .

但是削减的好方法git log -p是每次我找到提交行时都进行拆分。然后在这些不同的块上工作。我还需要从提交中获取注释块和所有“差异”块,它们位于多行上。

当我想获取要放入变量的 2 次提交之间的整个文本时,我遇到了问题......使用正则表达式^commit.{41}(.*?)^commit.{41}(我将不得不考虑 git 日志的最后一次提交,因为它不会t 以提交行结束)。稍后我将需要相同的方法diffBlock

我已经尝试了很多东西......例如像这样,但它不能正常工作。它发现了几个集团,但不是全部......(这可能是一个问题"\n",我不知道)

content = open("catchCommitBlock.txt","rt", encoding="ISO-8859-1").read() #testing file
commitBlock = re.compile("^commit.{41}(.*?)^commit.{41}",re.DOTALL|re.M)
i=0
while i < len (commitBlock.findall(content)):
    print (commitBlock.findall(content)[i])
    i+=1

你知道我如何解决这个问题吗?

PS如果我有不清楚的地方,请告诉我^^

4

1 回答 1

0

为什么不使用 Python 的 (uni)diff 解析器库?比如这个

于 2013-06-25T14:54:50.390 回答