我如何判断两个源代码(独立于它们的语言 C、Java、Lisp ......)有强烈的迹象表明它们可能是互相抄袭的?
背景:我将举办我的第一次计算机语言研讨会。我们为主要的编程语言准备了一些小练习,例如 C/C++、Python、Java……以及 OCaml、Haskell……给学生一些实用的介绍(也包括编程范式)。我们估计有大约 300 名学生每人有超过 50 个编程任务。所以一个人不能检查所有的作业。
我想用于自然语言(论文、论文、书籍章节等)的反抄袭技术不适用于源代码,对吧?由于所需的接口,这些编程任务的解决方案也将具有固有的相似性。
我做了一些搜索,发现:MOSS在:Checking for code plagiarism with JavaScript and Variable renaming for plagiarism detection for C/C++