-5

我对抄袭检查器(例如 Turnitin 网站)的工作方式印象深刻。但是他们是怎么做到的呢?以一种非常有效的方式,我是这个领域的新手,因此是否有任何单词匹配算法或任何类似于用于检测相似句子的算法?
非常感谢。

4

1 回答 1

2

我敢肯定,许多现实世界的抄袭检测系统使用更复杂的方案,但是检测两件事相距多远的一般问题称为编辑距离。该链接包括许多用于此目的的常用算法的链接。要点有效地回答了“我必须执行多少次编辑才能将一个输入转换为另一个?”的问题。现实世界系统面临的挑战是以有效的方式在大型语料库中执行此操作。一个相关的问题是最长的公共子序列,这也可能有助于此类方案识别逐字复制的段落。

于 2013-11-26T23:26:14.690 回答