检查这是否有效。我发现这个网站似乎列出了所有可能在日语文本中使用的 Unicode 字符。
相应的正则表达式(对于单个字符)将是:
/[\u3000-\u303f\u3040-\u309f\u30a0-\u30ff\uff00-\uff9f\u4e00-\u9faf\u3400-\u4dbf]/
-------------_____________-------------_____________-------------_____________
Punctuation Hiragana Katakana Full-width CJK CJK Ext. A
Roman/ (Common & (Rare)
Half-width Uncommon)
Katakana
范围是(引自网站):
3000 - 303f
: 日式标点符号
3040 - 309f
: 平假名
30a0 - 30ff
: 片假名
ff00 - ff9f
: 全角罗马字符和半角片假名
4e00 - 9faf
: 中日韩统一表意文字 - 常见和不常见的汉字
3400 - 4dbf
: 中日韩统一表意文字扩展 A - 稀有汉字
我稍微改变了范围:
- 对于全角罗马字符和半角片假名,我已经从 更改
ff00 - ffef
为。来自的代码点包含韩文半角字符,这不是您想要的。您可能想从 重新添加代码点,但它们大多是半角标点符号或全角货币符号。ff00 - ff9f
ffa0 - ffdc
ffe0 - ffef
您可以检查该站点并取消您不想要的任何范围,或者确保它不会出现在您的输入中。