0

我正在使用 MongoDB 来存储数百万个用户文档。
每个文档都有一个first_namelast_name键(列)。
网站的访问者有一个文本框,用于为用户查询数据库。
我的目标是这样的输入:
John Doe并且 应该返回一个可能的名称列表,例如:、、、等......意思是
Doe John, 应该返回不区分名字/姓氏和“类似声音”的名字。
Dow Jones

John DoeDoe JohnDow JonesJoan DoeJohan Dow

如何才能做到这一点?

编辑:我不必在数据库引擎中这样做。应用程序级别的搜索也是可以接受的。

4

1 回答 1

1

有许多语音算法与实现“听起来像”匹配相关。这些具有不同的有效性,具体取决于文化差异,例如拼写、发音和名称语料库中使用的语言。

最近的一篇文章Using Fuzzy Matching to Search by Sound with Python提供了一些可用选项的有用概述:

于 2012-07-01T21:42:33.823 回答