问题标签 [character-properties]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 在Java中获取一种语言的unicode字符
Java中有什么方法可以让我获得特定语言的所有Unicode字符(例如孟加拉语或阿拉伯语)?
java - Java正则表达式中\w和\b的Unicode等价物?
许多现代正则表达式实现将\w
字符类速记解释为“任何字母、数字或连接标点符号”(通常:下划线)。这样,正则表达式之类的\w+
匹配词,如hello
,或.élève
GOÄ_432
gefräßig
不幸的是,Java 没有。在 Java 中,\w
仅限于[A-Za-z0-9_]
. 这使得匹配上面提到的单词变得困难,以及其他问题。
似乎\b
单词分隔符在不应该匹配的地方匹配。
什么是类似 .NET、Unicode 感知\w
或\b
Java 的正确等价物?哪些其他快捷方式需要“重写”以使它们能够识别 Unicode?
java - 任何符号的Java正则表达式?
是否有接受任何符号的正则表达式?
编辑:澄清我在寻找什么..我想构建一个正则表达式,它将接受任意数量的空格,并且它必须包含至少 1 个符号(例如,." ' $ £ 等)或(非排他或)至少 1 个字符。
regex - Unicode正则表达式匹配换行符?
我有这个表格,我想从那里将数据提交到数据库。数据为 UTF8。我在匹配换行符时遇到问题。我使用的模式是这样的:
这种模式可以正常工作,直到用户在他的文本框中添加一个新行。我曾尝试\p{Z}
在课堂内使用,但没有成功。我也试过“s”,但没有用。
任何帮助深表感谢。谢谢!
c# - 使用正则表达式匹配 C# Unicode 标识符
使用 .Net Regex 模式匹配 C# 标识符(特别是属性或字段名称)的正确方法是什么?
背景。我曾经使用以 ASCII 为中心的 @"[_a-zA-Z][_a-zA-Z0-9]*" 但现在 unicode 大写和小写字符是合法的,例如“AboöДЖem”。我应该如何将这些包含在模式中?
谢谢,马克斯
javascript - 匹配 ASCII 和 Unicode 字母的正则表达式
最近,令我惊讶的是,JavaScript 没有内置对 Unicode 正则表达式的支持。
那么我怎样才能测试一个字符串只包含字母、Unicode 或 ASCII 呢?
unicode - Unicode 字母字符列表
我需要具有http://www.unicode.org/Public/5.1.0/ucd/UCD.html#AlphabeticAlphabetic
中定义的属性的 Unicode 字符范围列表。但是,无论我如何搜索它们,我都无法在 Unicode 字符数据库中找到它们。有人可以提供它们的列表还是仅提供具有指定 Unicode 属性的字符的搜索工具?
ruby - Ruby:如何检查 UTF-8 字符串是否只包含字母和数字?
我有一个 UTF-8 字符串,它可能是任何语言。
如果它不包含任何非字母数字字符,我该如何检查?
我在 UnicodeUtils Ruby gem 中找不到这样的方法。
例子:
- ėččę91 - 有效
- $120D - 无效
php - 匹配 PCRE/PHP 中的 Unicode 字母字符
我正在尝试为 PHP 中的名称编写一个合理允许的验证器,我的第一次尝试包括以下模式:
这最终传递给对 的调用preg_match()
。据我所知,这适用于您的香草 ASCII 字母,但似乎与 Ă 或张等更刺激的字符有关。
模式本身有问题吗?也许我期望\p{L}
做的工作比我想象的要多?
或者它与输入的传递方式有关?我不确定它是否相关,但我确实确保在表单页面上指定了 UTF8 编码。
python - 匹配python正则表达式中的unicode字符
我已经阅读了 Stackoverflow 上的其他问题,但仍然没有接近。对不起,如果这已经得到回答,但我没有得到任何建议在那里工作。
一切都很好,然后我尝试了一些带有挪威字符的东西(或者更像 unicode 的东西):
如何匹配典型的 unicode 字符,例如 øæå?我也希望能够在上面的标签组和文件名中匹配这些字符。