当我用 JavaScript 编写时,"Ł" > "Z"
它返回true
. 在 Unicode 顺序中它当然应该是false
. 如何解决这个问题?我的网站使用的是 UTF-8。
6 回答
您可以使用ECMAScript Internationalization API引入的Intl.Collator
or :String.prototype.localeCompare
"Ł".localeCompare("Z", "pl"); // -1
new Intl.Collator("pl").compare("Ł","Z"); // -1
-1
意味着Ł
之前Z
,就像你想要的那样。
请注意,它仅适用于最新的浏览器。
这是一个可以帮助您进行自定义排序的法语字母示例:
var alpha = function(alphabet, dir, caseSensitive){
return function(a, b){
var pos = 0,
min = Math.min(a.length, b.length);
dir = dir || 1;
caseSensitive = caseSensitive || false;
if(!caseSensitive){
a = a.toLowerCase();
b = b.toLowerCase();
}
while(a.charAt(pos) === b.charAt(pos) && pos < min){ pos++; }
return alphabet.indexOf(a.charAt(pos)) > alphabet.indexOf(b.charAt(pos)) ?
dir:-dir;
};
};
要在字符串数组上使用它a
:
a.sort(
alpha('ABCDEFGHIJKLMNOPQRSTUVWXYZaàâäbcçdeéèêëfghiïîjklmnñoôöpqrstuûüvwxyÿz')
);
添加1
或-1
作为第二个参数alpha()
以升序或降序排序。
添加true
为第三个参数以区分大小写。
您可能需要在字母列表中添加数字和特殊字符
您可以使用localeCompare()
它来构建自己的排序功能 - 至少根据MDC 关于该主题的文章- 应该正确排序。
如果这不起作用,这是一个有趣的 SO 问题,其中 OP 使用字符串替换来构建“蛮力”排序机制。
同样在那个问题中,OP 展示了如何为 jQuery tablesorter 插件构建一个自定义textExtract
函数,该插件进行区域设置感知排序 - 也许也值得一看。
编辑:作为一个完全遥不可及的想法 - 我不知道这是否可行,特别是因为性能问题 - 如果你在后端使用 PHP/mySQL,我想提一下的可能性将 Ajax 查询发送到 mySQL 实例以对其进行排序。ORDER BY xyz COLLATE utf8_polish_ci
mySQL 擅长对区域感知数据进行排序,因为您可以使用例如, ... 将排序操作强制到特定的排序规则中。COLLATE utf8_german_ci
这些排序规则会立即解决所有排序问题。
Mic 的代码针对未提及的字符进行了改进:
var alpha = function(alphabet, dir, caseSensitive){
dir = dir || 1;
function compareLetters(a, b) {
var ia = alphabet.indexOf(a);
var ib = alphabet.indexOf(b);
if(ia === -1 || ib === -1) {
if(ib !== -1)
return a > 'a';
if(ia !== -1)
return 'a' > b;
return a > b;
}
return ia > ib;
}
return function(a, b){
var pos = 0;
var min = Math.min(a.length, b.length);
caseSensitive = caseSensitive || false;
if(!caseSensitive){
a = a.toLowerCase();
b = b.toLowerCase();
}
while(a.charAt(pos) === b.charAt(pos) && pos < min){ pos++; }
return compareLetters(a.charAt(pos), b.charAt(pos)) ? dir:-dir;
};
};
function assert(bCondition, sErrorMessage) {
if (!bCondition) {
throw new Error(sErrorMessage);
}
}
assert(alpha("bac")("a", "b") === 1, "b is first than a");
assert(alpha("abc")("ac", "a") === 1, "shorter string is first than longer string");
assert(alpha("abc")("1abc", "0abc") === 1, "non-mentioned chars are compared as normal");
assert(alpha("abc")("0abc", "1abc") === -1, "non-mentioned chars are compared as normal [2]");
assert(alpha("abc")("0abc", "bbc") === -1, "non-mentioned chars are compared with mentioned chars in special way");
assert(alpha("abc")("zabc", "abc") === 1, "non-mentioned chars are compared with mentioned chars in special way [2]");
您必须保留两个排序键字符串。一种用于初级顺序,其中德语 ä=a(初级 a->a)和法语 é=e(初级排序键 e->e)和一种用于次级顺序,其中 ä 出现在 a 之后(在次级中翻译 a->azzzz key) 或 é 出现在 e 之后(辅助键 e->ezzzz)。特别是在捷克语中,一些字母是字母的变体(áéí...),而另一些则完全位于列表中(ABCČD...GHChI...RŘSŠT...)。加上考虑有向图单个字母的问题(主要 ch->hzzzz)。不是小问题,JS内部应该有解决方案。
有趣的是,我必须考虑这个问题并在这里完成搜索,因为它想到了,我可以使用我自己的 javascript 模块。我编写了一个模块来生成一个干净的 URL,因此我必须翻译输入字符串...(http://pid.github.io/speakingurl/)
var mySlug = require('speakingurl').createSlug({
maintainCase: true,
separator: " "
});
var input = "Schöner Titel läßt grüßen!? Bel été !";
var result;
slug = mySlug(input);
console.log(result); // Output: "Schoener Titel laesst gruessen bel ete"
现在您可以使用此结果进行排序。你可以前。将原始标题存储在“title”字段中,将用于排序的字段存储在“title_sort”中,并使用 mySlug 的结果。