抱歉,如果这是题外话,但这是您减少本网站上“家庭作业”问题数量的机会:-)
我正在教授一门 C 编程课程,学生们在其中使用 C 中的一个小型数字例程库。今年,来自几组学生的源文件中有大量的代码重复。
(下至同样拼错的printf
调试语句。我的意思是,你能有多笨。)
我知道 Git 可以检测到两个源文件何时彼此相似超过某个阈值,但我从来没有管理过它来处理两个不在 Git 存储库中的源文件。
请记住,这些不是特别成熟的学生。他们不太可能会麻烦更改变量/函数名称。
有没有办法可以使用 Git 来检测重要的字面代码重复,也就是抄袭?或者您是否可以为此推荐其他一些工具