问题标签 [accent-insensitive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
12921 浏览

javascript - JavaScript 中的程序化重音减少(又名文本规范化或非重音)

我需要比较两个字符串,例如:

吕贝克 == 吕贝克

在 JavaScript 中。

为什么?好吧,我有一个自动完成字段,它使用 Lucene 发送到 Java 服务,其中地名自然存储(如 Lübeck),但也作为规范化文本进行索引,

这样,不知道输入“Mèxico”的人可以输入“mexico”并获得返回“Mèxico”的匹配项(在许多其他可能的点击中,例如“CaféMèxico,迪拜,阿联酋”)。

现在的问题是我无法更改服务以在服务器端进行任何突出显示,因此我在客户端 JavaScript 端突出显示类似的内容:

这有点花哨,因为我在输入中转义了特殊的正则表达式字符。这对于在点击开始时简单的一个单词匹配很好,但如果你突然希望支持像“london cafe”这样的多单词匹配,它真的会崩溃:

这不适用于说“london ca”(正在输入 london cafe),因为它会将“Jack London Cabin, Dawson City, Canada”标记为:"Ja<b>ck</b> <b>London</b> <b>ca</b>bin, Dawson <b>Ci</b>ty, <b>Ca<b/>nada"[特别注意“ck”和“Ci”]

因此,我正在寻找一些不像以下内容那么疯狂的东西:

是否有一个编译表我可以参考映射一系列字符,这些字符是另一个字符的重音版本到该字符,我不是指普通的 unicode 图表。如果是这样,我是否可以避免使用奇怪的、可能很慢的 RegEx 语句?

关于赏金:
在我开始赏金之前,有两个答案,一个是让我用 Ruby 来做,另一个MizzardX写的,它是我在问题中提出的基本形式的完成。现在不要误会我的意思,我真的很感激能像他那样完全解决问题,但我只是希望可能有另一种方法。到目前为止,似乎每个路过查看问题和答案的人都认为 MizzardX 可以很好地涵盖它,或者他们没有不同的方法。我会对不同的方法感兴趣,如果在赏金关闭之前它根本不可用,MizzardX 将赢得赏金(尽管在残酷的转折中,他的编辑使它成为社区 wiki 的答案,所以我不确定是否他会得到赏金的!)

0 投票
1 回答
10860 浏览

sqlite - SQLite 不区分重音搜索

有什么方法可以在 SQLite 中进行不区分重音的 LIKE 查询?例如,这个查询:

会返回:

如果有任何区别,我将 Qt 与 QSqlDatabase 一起使用。

0 投票
7 回答
5837 浏览

mysql - MySQL REGEXP 查询 - 不区分重音的搜索

我正在查询一个葡萄酒名称数据库,其中许多都包含重音(但不是以统一的方式,因此可以输入带有或不带有重音的类似葡萄酒)

基本查询如下所示:

这将返回标题中带有“Faugeres”的条目,但不返回“Faugeres”

相反。

我曾想过这样的事情:

可能会成功,但这只会返回没有重音的结果。

该字段被整理为 utf8_unicode_ci,从我读过的内容来看,它应该是这样的。

有什么建议么?!

0 投票
2 回答
957 浏览

java - 不带重音的搜索必须返回带重音的单词

我有一个使用 Hibernate、Spring 和 Java 开发的 Web 应用程序,它可以访问 Informix 数据库......

想象一下,您正在搜索某条带有重音符号的记录,例如“María”,但您在搜索框中输入“Maria”......现在它没有显示任何结果,但它必须显示“María”记录,以及任何其他组合,例如“Maríá”或“Máríá”或“Mária”等...

我怎样才能实现它?提前致谢...

0 投票
1 回答
8789 浏览

sql-server - 关于 SQL Server 中重音不敏感的问题 (Latin1_General_CI_AS)

我们所有的数据库都是使用默认排序规则 ( Latin1_General_CI_AS) 安装的。

我们计划更改排序规则,以允许客户在不区分口音的情况下搜索数据库。

问题:

  1. 拥有对口音不敏感的数据库有什么负面影响(如果有的话)?

  2. 对口音不敏感的数据库是否有任何性能开销?

  3. 为什么 SQL Server 排序规则的默认值区分重音;为什么有人要默认区分重音?

0 投票
2 回答
2645 浏览

jquery - 使 jquery :包含重音不敏感

我有这种不区分大小写的自定义选择器:

它工作正常,但它会被口音弄乱。我的问题很简单,我怎样才能使这个选择器既不区分大小写又不区分重音

我正在考虑使用带有正则表达式的字符映射,但我似乎无法使其正常运行。

谢谢你的帮助。

0 投票
1 回答
1763 浏览

iphone - 在 iPhone 上使用 sqlite3_create_collat​​ion

我想创建一个排序规则,以便在数据库中不区分大小写并且没有重音搜索。

这是我的代码:

当我执行此查询时:

它返回 0 而不是 1,并且从不调用我的自定义函数(我在函数中放置断点进行测试)。

当我使用“PRAGMA collat​​ion_list”列出所有排序规则时,我的自定义排序规则就存在了。

知道这个问题吗?

0 投票
1 回答
1420 浏览

javascript - 我如何扩展 jquery quicksearch 以便它可以搜索带有重音符号的单词?

哟,我目前正在开发这个网站,我正在使用 jquery isotope、wordpress 和 jquery quicksearch 它运行良好,但我想扩展它的功能。如果我输入“Mexico”,我希望快速搜索也可以与“México”一起使用,但我不知道在哪里编辑它。

这是我用于快速搜索的 js 代码:

和 jquery quicksearch 插件:

任何帮助都会很棒!

0 投票
2 回答
1055 浏览

unicode - 西里尔字母 'С' 和拉丁文 'C' 的 Unicode 比较

我有一个混合使用 unicode 字符 \u0421、'С' 和 \u0043、'C' 的数据集。是否存在某种认为这两个字符相同的 unicode 比较?到目前为止,我已经尝试了几种 ICU 排序规则,包括俄罗斯的排序规则。

0 投票
2 回答
843 浏览

neo4j - Neo4J 中的重音不敏感查询

进行不区分大小写的 Cypher 查询非常容易。我现在正试图弄清楚是否有一种简单的方法可以进行口音不敏感查询。我正在考虑类似于以下的查询:

MATCH n:City WHERE n.Name =~ '(?a)Montreal' RETURN n

有人找到解决方案了吗?我必须依赖于创建FullText Lucene IndexCustom Analyzer