问题标签 [character-class]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5997 浏览

mysql - MySQL regexp 方括号的元字符列表

奇怪的是,我似乎无法在任何地方找到我不能安全地用作 MySQL 正则表达式方括号中的文字的字符列表,而无需转义它们或需要使用某个[:character_class:]东西。

(而且答案可能需要特定于 MySQL,因为与 Perl/PHP/Javascript 等中的正则表达式相比,MySQL 正则表达式似乎缺乏)。

0 投票
5 回答
2555 浏览

java - 支持哪些内置正则表达式字符类 Java

...当用于"\\p{someCharacterClass}".
我用过/看过一些:

  • 降低
  • 组合变音符号
  • ASCII

所有受支持的内置字符分类的最终列表是什么?它记录在哪里?具体含义是什么?

已编辑...

似乎有很多“RTFM”答案是指Pattern. 这是我在问这个问题之前看到的第一个地方。大家都很清楚,Pattern 的 javadoc 没有提到上面列出的任何类。

“正确”答案将在页面某处提及“InCombiningDiacriticalMarks”,而不是对“Unicode 标准”的模糊引用。

0 投票
1 回答
3541 浏览

regex - 让 awk 使用字符类

如何让 awk 识别字符类?

例如,这个:

按预期输出1,但是:

在我期望的地方没有输出任何东西,1并且2在过滤器中存活下来。

我认为这可能与外壳转义(zsh)有关,但awk '/\\d/'也不起作用。

0 投票
5 回答
345 浏览

java - Java - 静态定义的字符列表

在任何标准库中是否有字符类(字母、数字、字母数字)的定义?我正在检查字符串是否仅包含字母数字字符或冒号:

我可以自己定义 ALPHA_NUMERIC,但似乎通用字符类将在标准库中定义,尽管我一直无法找到定义。

编辑:我确实考虑过正则表达式,但对于我的特定用例,执行时间很重要,简单的扫描更有效。

编辑:这里是使用 Regex、CharMatcher 和简单扫描的测试结果(对每个测试使用相同的一组有效/无效输入字符串):

有效输入字符串:

CharMatcher,运行次数:1000000,有效字符串:true,时间(毫秒):1200

正则表达式,运行次数:1000000,有效字符串:true,时间(毫秒):909

扫描,运行次数:1000000,有效字符串:true,时间(毫秒):96

无效的输入字符串:

CharMatcher,运行次数:1000000,有效字符串:false,时间(毫秒):277

正则表达式,运行次数:1000000,有效字符串:false,时间(毫秒):253

扫描,运行次数:1000000,有效字符串:false,时间(毫秒):36

这是执行扫描的代码:

编辑:我重新编译为一个独立的程序(我正在通过 eclipse 运行):

CharMatcherTester,运行次数:1000000,有效字符串:true,时间(毫秒):418

RegexTester,运行次数:1000000,有效字符串:true,时间(毫秒):812

ScanTester,运行次数:1000000,有效字符串:true,时间(毫秒):88

CharMatcherTester,运行次数:1000000,有效字符串:false,时间(毫秒):142

RegexTester,运行次数:1000000,有效字符串:false,时间(毫秒):223

ScanTester,运行次数:1000000,有效字符串:false,时间(毫秒):32

来源:https ://bitbucket.org/jdeveloperw/testing (这是我第一次将测试结果发布到 SO,因此感谢您的评论。)

0 投票
1 回答
4075 浏览

java - Groovy Regex:字符类中的波浪号有什么作用?

我有这个来自 groovy 代码的正则表达式:

我唯一不明白的是这部分:

波浪号在那里做什么?这是一个错误吗?或者只是角色类的一些开关?

我的理解是第一行和第三行确实匹配单词边界,而第二行匹配有问题的文本(长短形式)。

我尝试用谷歌搜索(当然在这里搜索)但不幸的是,该图块属于 groovy 中的“匹配这个”运算符,所以我在这里找到的所有内容都是关于如何正则表达式的一般信息。

0 投票
1 回答
124 浏览

ruby - 为什么我看到这两个几乎相同的 Ruby 正则表达式模式的结果不同,为什么一个匹配我认为它不应该匹配的结果?

使用 Ruby 1.9.2,我在 IRB 中有以下 Ruby 代码:

这将产生以下输出:

1.) 为什么结果不同?

2.) 为什么会r1在字符串 2、3 和 4 上匹配?(?=.*[\W])由于这些示例中没有任何非单词字符,因此前瞻性不会导致它失败吗?

0 投票
1 回答
586 浏览

python - 正则表达式:字符类中的 \Z

正则表达式:

它应该捕获以字符串或字符串blah结尾@或结尾的符号符号。\Z在字符类中包含正确的技术吗?

0 投票
2 回答
144615 浏览

xml - 正则表达式 \p{L} 和 \p{N}

我是正则表达式的新手,并获得了以下正则表达式:

我知道 * 是什么意思和 | 表示“或”,而 \ 转义。

但我不知道什么\p{L}\p{N}意味着什么。我用谷歌搜索了它,没有结果......

有人能帮我吗?

0 投票
1 回答
574 浏览

regex - php preg_match 使用速记和字符类相结合

当明显有字符匹配范围“[AZ]”时,它如何显示0?

它是解析发生的方式吗?

0 投票
2 回答
292 浏览

ruby - 如何为字母、元音和辅音等德语字符类编写正则表达式?

例如,我设置了这些:

所以/(#{K}#{V}{2})/匹配"ßäÜ""azAZßäÜ".

有没有更好的方法来对付它们?

我可以将这些常量放在我的 Ruby 安装文件夹中某个文件的模块中,这样我就可以在我在计算机上编写的任何新脚本中包含/要求它们吗?(我是新手,我知道我混淆了这个术语;请纠正我。)

此外,我可以只让元字符\L,\V\K(或任何尚未在 Ruby 中设置的)在正则表达式中代表它们,所以我不必一直做字符串插值吗?