我知道使用基本 SQL 和活动记录查询语言在单个表中查找精确重复记录的方法。但我需要知道如何执行紧密匹配搜索,我想考虑拼写错误。在 Rails 应用程序中查找潜在重复项和接近匹配项的最佳方法是什么?我使用 MySQL 作为数据库。
编辑:我想要匹配的数据类型是字符串,它们作为字符串存储在数据库中。
我知道使用基本 SQL 和活动记录查询语言在单个表中查找精确重复记录的方法。但我需要知道如何执行紧密匹配搜索,我想考虑拼写错误。在 Rails 应用程序中查找潜在重复项和接近匹配项的最佳方法是什么?我使用 MySQL 作为数据库。
编辑:我想要匹配的数据类型是字符串,它们作为字符串存储在数据库中。
I think thinking_sphinx and Sphinx might be two interesting tools for you. What you want is provided by a set of feature called full text search wich is a big topic to explain in a single answer but you will probably want to learn about "word proximity" and "lexemes"