问题标签 [soundex]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
14377 浏览

fuzzy-search - Levenshtein 基于距离的方法与 Soundex

根据相关线程中的评论,我想知道为什么基于 Levenshtein 距离的方法比 Soundex 更好。

0 投票
1 回答
1420 浏览

soundex - 如何制作国际 Soundex?

例如,Soundex 算法针对英语进行了优化。是否有更通用的算法适用于大型语言系列?

0 投票
2 回答
1021 浏览

linq-to-sql - 是否可以在 LinqToSql 中使用 Soundex(或其他 SQL 函数)?

我正在重构一些当前在存储过程中实现的代码以使用 LinqToSql(用于培训)。是否可以在 linqToSql 查询中使用 SQL 函数?

0 投票
2 回答
1267 浏览

metaphone - 双变位错误

我正在使用Lawrence Philips Double-Metaphone算法取得了巨大成功,但我发现某些组合出现了奇怪的“意外结果”。

是否有其他人对算法的其他部分进行了添加或更改,他们不介意共享,或者只是他们发现无法按预期工作的组合。

例如。我有以下问题:

  • 皮希尔和布什利。(均与 PXL 匹配)
  • 罗克利夫和罗克利夫(RKLF 和 RKKL)
0 投票
6 回答
2091 浏览

java - soundex算法的数据结构?

谁能建议我使用soundex 算法程序的数据结构?使用的语言是Java。如果有人以前在 Java 中做过这方面的工作。该程序应具有以下功能: 能够阅读大约 50,000 个单词 应该能够阅读一个单词并返回具有相同 soundex 的相关单词

我不希望程序实现只是关于使用什么数据结构的一些建议。

0 投票
4 回答
3708 浏览

sql-server - SQL Server 对非拉丁字符集的 SoundEx 函数?

SQL Server (2000) Soundex 函数是否适用于亚洲字符集?我在查询中使用它,它似乎没有正常工作,但我意识到这可能是因为我不知道如何阅读中文......

此外,是否还有其他语言可能无法使用该功能?(例如俄语)

谢谢你,
弗兰克

0 投票
2 回答
1217 浏览

soundex - 当 php SOUNDEX 仅输出 3 位数字时如何在 php 中检查 SOUNDEX

我正在尝试使用 SOUNDEX 对公司名称进行比较,但对 soundex 的 php 调用仅输出 3 位数字,因此比较不太准确。有没有办法获得更好的 soundex 输出,从而使结果更准确?

0 投票
4 回答
4876 浏览

c++ - 使用 C++ 实现 Soundex 算法

简而言之,Soundex 算法将一系列字符转换为代码。产生相同 Soundex 代码的字符被称为听起来相同。

  • 代码为 4 个字符宽
  • 代码的第一个字符始终是单词的第一个字符

字母表中的每个字符都属于一个特定的组(至少在本例中,此后的代码是我将坚持的规则):

  • b, p, v, f = 1
  • c、g、j、k、q、s、x、z = 2
  • d, t = 3
  • l = 4
  • 米,n = 5
  • r = 6
  • 字母表中的每个其他字母都属于第 0 组。

其他值得注意的规则包括:

  • 属于组 0 的所有字母都将被忽略,除非您提供的单词中的字母已用完,在这种情况下,其余代码将用 0 填充。
  • 同一数字不能连续使用两次或多次,因此该字符被忽略。唯一的例外是上面带有多个 0 的规则。

例如,单词“Ray”将产生以下 Soundex 代码:R000(R 是所提供单词的第一个字符,a 是第 0 组的一部分,所以它被忽略,y 是第 0 组的一部分,所以它被忽略,没有更多字符,因此代码中剩余的 3 个字符为 0)。

我创建了一个已传递给它的函数 1)一个 128 个字符的数组,用于创建 Soundex 代码和 2)一个空的 5 个字符数组,用于在函数完成时存储 Soundex 代码(和就像大多数数组在我的程序中使用一样,通过引用传回)。

但是,我的问题是转换过程。我上面提供的逻辑在我的代码中并不完全有效。同时我不知道为什么。

我不确定这是否是因为我过度使用了 strlen,但由于某种原因,当程序在第一个 while 循环中运行时,实际上没有任何字符被转换为代码(即实际上没有运行任何 if 语句)。

那么我做错了什么?任何帮助将不胜感激。

0 投票
3 回答
3360 浏览

sql-server - 在 SQL Server 2005 中使用全文搜索的“听起来很像”、“你是说那个”功能

我已经使用 CONTAINSTABLE 关键字在 SQL Server 2005 数据库上实现了全文搜索。我想知道如果原始查询没有产生任何结果,是否有办法添加“听起来像”或谷歌的“你的意思是那个”功能。

0 投票
2 回答
9360 浏览

algorithm - 为非英文字符启用 soundex/metaphone

过去几天我一直在研究 soundex、metaphone 和其他字符串搜索技术,据我了解,这两种算法都可以很好地处理转译为英语的非英语单词。

然而,我的要求是让这种搜索在原始的、未音译的语言中工作,适应德语、挪威语甚至西里尔字母等字母。

是否有任何搜索算法能够完全处理这些字母?还是我最好使用第三方全文搜索库,例如 Lucene?因此,问题就变成了“Lucene 是否处理非英文字母?”