问题标签 [soundex]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
fuzzy-search - Levenshtein 基于距离的方法与 Soundex
根据相关线程中的此评论,我想知道为什么基于 Levenshtein 距离的方法比 Soundex 更好。
soundex - 如何制作国际 Soundex?
例如,Soundex 算法针对英语进行了优化。是否有更通用的算法适用于大型语言系列?
linq-to-sql - 是否可以在 LinqToSql 中使用 Soundex(或其他 SQL 函数)?
我正在重构一些当前在存储过程中实现的代码以使用 LinqToSql(用于培训)。是否可以在 linqToSql 查询中使用 SQL 函数?
metaphone - 双变位错误
我正在使用Lawrence Philips Double-Metaphone算法取得了巨大成功,但我发现某些组合出现了奇怪的“意外结果”。
是否有其他人对算法的其他部分进行了添加或更改,他们不介意共享,或者只是他们发现无法按预期工作的组合。
例如。我有以下问题:
- 皮希尔和布什利。(均与 PXL 匹配)
- 罗克利夫和罗克利夫(RKLF 和 RKKL)
java - soundex算法的数据结构?
谁能建议我使用soundex 算法程序的数据结构?使用的语言是Java。如果有人以前在 Java 中做过这方面的工作。该程序应具有以下功能: 能够阅读大约 50,000 个单词 应该能够阅读一个单词并返回具有相同 soundex 的相关单词
我不希望程序实现只是关于使用什么数据结构的一些建议。
sql-server - SQL Server 对非拉丁字符集的 SoundEx 函数?
SQL Server (2000) Soundex 函数是否适用于亚洲字符集?我在查询中使用它,它似乎没有正常工作,但我意识到这可能是因为我不知道如何阅读中文......
此外,是否还有其他语言可能无法使用该功能?(例如俄语)
谢谢你,
弗兰克
soundex - 当 php SOUNDEX 仅输出 3 位数字时如何在 php 中检查 SOUNDEX
我正在尝试使用 SOUNDEX 对公司名称进行比较,但对 soundex 的 php 调用仅输出 3 位数字,因此比较不太准确。有没有办法获得更好的 soundex 输出,从而使结果更准确?
c++ - 使用 C++ 实现 Soundex 算法
简而言之,Soundex 算法将一系列字符转换为代码。产生相同 Soundex 代码的字符被称为听起来相同。
- 代码为 4 个字符宽
- 代码的第一个字符始终是单词的第一个字符
字母表中的每个字符都属于一个特定的组(至少在本例中,此后的代码是我将坚持的规则):
- b, p, v, f = 1
- c、g、j、k、q、s、x、z = 2
- d, t = 3
- l = 4
- 米,n = 5
- r = 6
- 字母表中的每个其他字母都属于第 0 组。
其他值得注意的规则包括:
- 属于组 0 的所有字母都将被忽略,除非您提供的单词中的字母已用完,在这种情况下,其余代码将用 0 填充。
- 同一数字不能连续使用两次或多次,因此该字符被忽略。唯一的例外是上面带有多个 0 的规则。
例如,单词“Ray”将产生以下 Soundex 代码:R000(R 是所提供单词的第一个字符,a 是第 0 组的一部分,所以它被忽略,y 是第 0 组的一部分,所以它被忽略,没有更多字符,因此代码中剩余的 3 个字符为 0)。
我创建了一个已传递给它的函数 1)一个 128 个字符的数组,用于创建 Soundex 代码和 2)一个空的 5 个字符数组,用于在函数完成时存储 Soundex 代码(和就像大多数数组在我的程序中使用一样,通过引用传回)。
但是,我的问题是转换过程。我上面提供的逻辑在我的代码中并不完全有效。同时我不知道为什么。
我不确定这是否是因为我过度使用了 strlen,但由于某种原因,当程序在第一个 while 循环中运行时,实际上没有任何字符被转换为代码(即实际上没有运行任何 if 语句)。
那么我做错了什么?任何帮助将不胜感激。
sql-server - 在 SQL Server 2005 中使用全文搜索的“听起来很像”、“你是说那个”功能
我已经使用 CONTAINSTABLE 关键字在 SQL Server 2005 数据库上实现了全文搜索。我想知道如果原始查询没有产生任何结果,是否有办法添加“听起来像”或谷歌的“你的意思是那个”功能。
algorithm - 为非英文字符启用 soundex/metaphone
过去几天我一直在研究 soundex、metaphone 和其他字符串搜索技术,据我了解,这两种算法都可以很好地处理转译为英语的非英语单词。
然而,我的要求是让这种搜索在原始的、未音译的语言中工作,适应德语、挪威语甚至西里尔字母等字母。
是否有任何搜索算法能够完全处理这些字母?还是我最好使用第三方全文搜索库,例如 Lucene?因此,问题就变成了“Lucene 是否处理非英文字母?”