1
4

2 回答 2

3

如果要删除除基本拉丁语以外的所有符号,只需应用正则表达式,例如

str = str.replace(/[\u0080-\uFFFF]+/g, "");

请参阅此 unicode 字符列表以选择您需要接受或不接受的字符

于 2012-04-13T15:39:51.703 回答
2

首先,请确保您绝对不能使用那些“有问题的”符号。干净的现代程序应该正确理解任何语言的输入。

至于您删除任何不可读内容的请求,最好指定您要留下的内容,因为 F. Calderan 的示例不会删除指定 FFFF 位置上方的任何额外 Unicode 符号。所以,考虑到你只想要 ASCII:

str = str.replace(/[^\u0000-\u007F]+/g, "");
于 2012-04-13T16:09:37.387 回答