1

我想在 PHP/Python/C/C++ 库/应用程序中有一个简单且轻量级的库/应用程序来匹配/更正/提供输入建议。输入/输出示例:

  1. 输入:Web 开发 ==> 输出:Web 开发
  2. 输入:Web 开发 ==> 输出:Web 开发
  3. 输入:Web 开发 ==> 输出:Web 开发

鉴于有正确单词和短语的数据库,我只需要该库来匹配/猜测短语。如果您知道,请提出建议。

4

2 回答 2

3

我猜你想要做的是计算字符串(输入、输出对)之间的编辑距离。其中一个更简单的(我用它来从 3 个字母的短字母中找出一个团队的全名 - 这是一个很长的故事......)是Levenshtein距离。页面上的最后一个外部链接有很多不同的实现(原来它是 PHP 4.0.1+ 的标准)。

于 2010-02-03T05:45:16.733 回答
3

Google 研究总监 Peter Norvik 的如何编写拼写校正器包含 21 行 Python 代码中的拼写校正器,并附有解释。

您必须自己将其转换为模块,但这应该很容易。当然,您还需要一个语料库(即单词),但他也提供了这些语料库的来源。

于 2010-02-06T16:56:22.257 回答