我想在 PHP/Python/C/C++ 库/应用程序中有一个简单且轻量级的库/应用程序来匹配/更正/提供输入建议。输入/输出示例:
- 输入:Web 开发 ==> 输出:Web 开发
- 输入:Web 开发 ==> 输出:Web 开发
- 输入:Web 开发 ==> 输出:Web 开发
鉴于有正确单词和短语的数据库,我只需要该库来匹配/猜测短语。如果您知道,请提出建议。
我想在 PHP/Python/C/C++ 库/应用程序中有一个简单且轻量级的库/应用程序来匹配/更正/提供输入建议。输入/输出示例:
鉴于有正确单词和短语的数据库,我只需要该库来匹配/猜测短语。如果您知道,请提出建议。
我猜你想要做的是计算字符串(输入、输出对)之间的编辑距离。其中一个更简单的(我用它来从 3 个字母的短字母中找出一个团队的全名 - 这是一个很长的故事......)是Levenshtein距离。页面上的最后一个外部链接有很多不同的实现(原来它是 PHP 4.0.1+ 的标准)。
Google 研究总监 Peter Norvik 的如何编写拼写校正器包含 21 行 Python 代码中的拼写校正器,并附有解释。
您必须自己将其转换为模块,但这应该很容易。当然,您还需要一个语料库(即单词),但他也提供了这些语料库的来源。