问题标签 [character-properties]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5700 浏览

java - 在Java中获取一种语言的unicode字符

Java中有什么方法可以让我获得特定语言的所有Unicode字符(例如孟加拉语或阿拉伯语)?

0 投票
3 回答
67359 浏览

java - Java正则表达式中\w和\b的Unicode等价物?

许多现代正则表达式实现将\w字符类速记解释为“任何字母、数字或连接标点符号”(通常:下划线)。这样,正则表达式之类的\w+匹配词,如hello,或.élèveGOÄ_432gefräßig

不幸的是,Java 没有。在 Java 中,\w仅限于[A-Za-z0-9_]. 这使得匹配上面提到的单词变得困难,以及其他问题。

似乎\b单词分隔符在不应该匹配的地方匹配。

什么是类似 .NET、Unicode 感知\w\bJava 的正确等价物?哪些其他快捷方式需要“重写”以使它们能够识别 Unicode?

0 投票
2 回答
16549 浏览

java - 任何符号的Java正则表达式?

是否有接受任何符号的正则表达式?

编辑:澄清我在寻找什么..我想构建一个正则表达式,它将接受任意数量的空格,并且它必须包含至少 1 个符号(例如,." ' $ £ 等)或(非排他或)至少 1 个字符。

0 投票
1 回答
3251 浏览

regex - Unicode正则表达式匹配换行符?

我有这个表格,我想从那里将​​数据提交到数据库。数据为 UTF8。我在匹配换行符时遇到问题。我使用的模式是这样的:

这种模式可以正常工作,直到用户在他的文本框中添加一个新行。我曾尝试\p{Z}在课堂内使用,但没有成功。我也试过“s”,但没有用。

任何帮助深表感谢。谢谢!

0 投票
3 回答
6884 浏览

c# - 使用正则表达式匹配 C# Unicode 标识符

使用 .Net Regex 模式匹配 C# 标识符(特别是属性或字段名称)的正确方法是什么?

背景。我曾经使用以 ASCII 为中心的 @"[_a-zA-Z][_a-zA-Z0-9]*" 但现在 unicode 大写和小写字符是合法的,例如“AboöДЖem”。我应该如何将这些包含在模式中?

谢谢,马克斯

0 投票
2 回答
9655 浏览

javascript - 匹配 ASCII 和 Unicode 字母的正则表达式

最近,令我惊讶的是,JavaScript 没有内置对 Unicode 正则表达式的支持。

那么我怎样才能测试一个字符串只包含字母、Unicode 或 ASCII 呢?

0 投票
4 回答
7648 浏览

unicode - Unicode 字母字符列表

我需要具有http://www.unicode.org/Public/5.1.0/ucd/UCD.html#AlphabeticAlphabetic中定义的属性的 Unicode 字符范围列表。但是,无论我如何搜索它们,我都无法在 Unicode 字符数据库中找到它们。有人可以提供它们的列表还是仅提供具有指定 Unicode 属性的字符的搜索工具?

0 投票
3 回答
3268 浏览

ruby - Ruby:如何检查 UTF-8 字符串是否只包含字母和数字?

我有一个 UTF-8 字符串,它可能是任何语言。

如果它不包含任何非字母数字字符,我该如何检查?

我在 UnicodeUtils Ruby gem 中找不到这样的方法。

例子:

  1. ėččę91 - 有效
  2. $120D - 无效
0 投票
5 回答
12866 浏览

php - 匹配 PCRE/PHP 中的 Unicode 字母字符

我正在尝试为 PHP 中的名称编写一个合理允许的验证器,我的第一次尝试包括以下模式:

这最终传递给对 的调用preg_match()。据我所知,这适用于您的香草 ASCII 字母,但似乎与 Ă 或张等更刺激的字符有关。

模式本身有问题吗?也许我期望\p{L}做的工作比我想象的要多?

或者它与输入的传递方式有关?我不确定它是否相关,但我确实确保在表单页面上指定了 UTF8 编码。

0 投票
3 回答
45929 浏览

python - 匹配python正则表达式中的unicode字符

我已经阅读了 Stackoverflow 上的其他问题,但仍然没有接近。对不起,如果这已经得到回答,但我没有得到任何建议在那里工作。

一切都很好,然后我尝试了一些带有挪威字符的东西(或者更像 unicode 的东西):

如何匹配典型的 unicode 字符,例如 øæå?我也希望能够在上面的标签组和文件名中匹配这些字符。