2

如果我想学习一般的模式识别,从什么地方开始(推荐一本书)是一个好地方?

另外,是否有人对如何应用这些算法来查找程序中的抽象模式有任何经验/知识?(重复的代码,做同样事情但方式略有不同的代码块等)

谢谢

编辑:我不介意数学密集型书籍。事实上,那将是一件好事。

4

8 回答 8

2

如果您在数学上相当自信,那么 Chris Bishop 的“模式识别和机器学习”或“用于模式识别的神经网络”的任何一本书都非常适合学习模式识别。

于 2009-02-10T12:23:04.407 回答
1

如果您可以访问编译期间生成的解析树,它会有所帮助。通过这种方式,您可以查找相似的树片段,忽略比您正在查看的更深的节点,这样您可以选择例如将两个子表达式相乘的节点,忽略子表达式的内容表达式。您可以将相同的逻辑应用于节点集合,例如,您想找到两个子表达式的乘法,其中这两个子表达式是更多子表达式的加法。您首先查找乘法,然后检查乘法下方的两个节点是否是加法,忽略任何更深层次的内容。

于 2009-02-10T12:17:48.350 回答
0

我建议查看一些开源项目的代码(例如FindBugsSIM),它们可以完成您所说的那种事情。

于 2009-02-10T12:13:31.170 回答
0

如果您使用一种受支持的语言,IntelliJ idea 有一个非常智能的结构搜索和替换,可以满足您的问题。

于 2009-02-10T12:17:07.883 回答
0

其他有趣的项目是PMDEclipse

Eclipse 对任何项目中的所有源代码都使用 AST(抽象语法树)。然后,工具可以注册某些类型的 AST(如 Java 源代码)并获得预处理视图,在其中可以添加其他信息(如文档链接、错误标记等)。

于 2009-02-10T12:17:36.383 回答
0

您可以查看的另一个项目是Duplo - 它是一个开源/GPL 项目,因此您可以通过从SourceForge获取代码来研究他们的方法。

于 2009-02-10T12:31:48.987 回答
0

这是特定于 .Net 和 Visual Studio 的,但它会在您的项目中找到重复的代码。它确实报告了我发现的一些误报,但它可能是一个很好的起点。

克隆侦探

于 2009-02-10T13:01:08.060 回答
0

一种模式是通过复制和粘贴方法克隆的代码。请参阅CloneDR了解一种工具,该工具通过比较相关语言的抽象语法树,自动找到此类代码,尽管布局发生变化,甚至克隆体发生变化。

CloneDR 适用于多种语言:C、C++、C#、Java、JavaScript、PHP、COBOL、Python,... 该网站显示了多种编程语言的克隆检测报告。

于 2010-03-23T22:47:36.530 回答