问题标签 [fuzzy-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
2281 浏览

c# - 使用 NHibernate 对串联全名进行模糊搜索

我正在尝试将以下 SQL 转换为 NHibernate:

我试图做这样的事情,但它不工作:

我基本上想要做的是能够在文本框中搜索客户的姓名,示例值为“bob smith”,并使用上面 SQL 中的 LIKE 表达式搜索数据库。

如果我要错误地搜索 FirstName 和 LastName 列,请帮助我另一种选择,但上面的 SQL 查询可以满足我的需要。

使用 2 个解决方案更新:

所以我现在找到了两个解决这个问题的方法。一种是使用 Criteria API。以下帖子的答案效果很好:https ://stackoverflow.com/a/2937100/670028

我找到的另一个解决方案要感谢我的一位乐于助人的同事,他建议使用 LINQ 投影和匿名类型。这是使用 LINQ 的解决方案:

0 投票
4 回答
5614 浏览

python - 在 Python 中使用 Whoosh 进行模糊字符串搜索

我在 MongoDB 中建立了一个大型银行数据库。我可以轻松地获取这些信息并用它创建索引。例如,我希望能够匹配银行名称“Eagle Bank & Trust Co of Missouri”和“Eagle Bank and Trust Company of Missouri”。以下代码适用于简单的模糊等,但无法实现上述匹配:

给我:

Whoosh可以实现我想要的吗?如果不是,我还有什么其他基于 python 的解决方案?

0 投票
1 回答
1005 浏览

search - 模糊搜索+倒排索引

我正在研究模糊搜索以及如何使用倒排索引从数据库中检索信息。我研究了倒排索引,我认为它只适用于精确匹配。East Lamar Street想象一下我的数据库中有字符串的情况。有人在找East Lmar Street,我在找什么East Lamar Street

它会使用编辑距离吗?

算法将如何运行?

数据库会使用倒排索引吗?

还是会进行全面扫描?

我看到它使用哈希在 O(1) 中进行操作。

0 投票
3 回答
1941 浏览

mysql - 不精确地搜索最近的时间值

我正在寻找一种编程和语法有效的方法来搜索基于时间戳的值。本质上我想找到最接近的时间戳匹配......

例如,在我的 MySQL 表中:

我想根据时间 4:04:40 查询这个表。我想返回记录 ID #3...如果我搜索 4:04:35 我想返回 ID #2...我该如何实现呢?我在这张表中有数百万行,我在想像 levenshtein dist 这样的东西会太慢..?

干杯!

0 投票
2 回答
5841 浏览

php - 在php中模糊搜索数组

搜索后我发现如何对字符串进行模糊搜索

但我有一个字符串数组

$search = {"a" => "laptop","b" => "screen" ....}

我从数据库 MySQL 中检索到的

是否有任何对单词数组进行模糊搜索的 php 类或函数

或者至少是一些有用信息的链接

我看到一条建议使用 PostgreSQL 的评论

它具有模糊搜索能力,但是

该公司已经有一个 MySQL 数据库

有什么推荐吗??

0 投票
2 回答
1834 浏览

hibernate - Hibernate Search 中的模糊索引

我完全理解模糊搜索,但在我的应用程序中,它们非常慢,有很多术语(约 500 毫秒)。我遇到了一个缓慢模糊搜索的解决方案,建议不要进行模糊搜索,而是使用 levenstein 算法对术语进行索引,这样常规关键字搜索就会产生模糊结果。

有没有办法用 Hibernate Search 做到这一点,最好使用注释?

0 投票
1 回答
129 浏览

ruby-on-rails - act_as_fuzzy_search 插件安装

我想安装模糊搜索插件。我搜索了很多,发现:

https://github.com/iulinu/rails-fuzzy-search

在我的模型中,我有:

但我收到以下错误:

有谁知道如何解决这一问题?

0 投票
1 回答
2276 浏览

javascript - 寻找更好的 JavaScript 文本匹配评分系统

我一直在为很多项目使用字符串分数。它非常适合对列表进行排序,例如名称、国家/地区等。

现在,我正在做一个项目,我想将一个术语与一组更大的文本进行匹配,而不仅仅是几个单词。比如,一段。

给定以下两个字符串:

我希望该术语eat返回string2高于string1. 但是,string1得分更高:

也许我认为string2应该得分更高的想法是错误的,如果这是您的逻辑,我很乐意听到有关该逻辑的论据。否则,关于更具上下文的 javascript 匹配算法的任何想法?

0 投票
1 回答
1005 浏览

nlp - 模糊句子搜索算法

假设我有一组短语 - 大约 10 000 - 平均长度 - 7-20 个单词,我想在其中找到一些给定的短语。我正在寻找的短语可能有一些错误——例如遗漏一两个词、一些词错位或一些随机词——例如我的数据库包含“当我骑着我的红色自行车时,我看到了克里斯汀”,而我非常想要“当我骑着我的蓝色自行车时,看到了 Christine”,或者“我骑着我的自行车,我看到了 Christine 和 Marion”。有什么好的方法可以解决这个问题?我知道 Levenhstein 的距离,我也认为这个问题可能没有简单、好的解决方案。

0 投票
1 回答
10452 浏览

elasticsearch - elasticsearch 模糊匹配 max_expansions & min_similarity

我在我的项目中使用模糊匹配主要是为了查找拼写错误和同名的不同拼写。我需要准确理解弹性搜索的模糊匹配是如何工作的,以及它是如何使用标题中提到的 2 个参数的。

据我了解,min_similarity是查询字符串与数据库中的字符串匹配的百分比。我找不到有关如何计算此值的确切描述。

据我所知, max_expansions是应该执行搜索的 Levenshtein 距离。如果这实际上是 Levenshtein 距离,那对我来说将是理想的解决方案。无论如何,它不起作用,例如我有“Samvel”这个词

文档说了一些我实际上不明白的内容:

所以请任何人向我解释这些参数究竟是如何影响搜索结果的。