问题标签 [character-class]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - MySQL regexp 方括号的元字符列表
奇怪的是,我似乎无法在任何地方找到我不能安全地用作 MySQL 正则表达式方括号中的文字的字符列表,而无需转义它们或需要使用某个[:character_class:]
东西。
(而且答案可能需要特定于 MySQL,因为与 Perl/PHP/Javascript 等中的正则表达式相比,MySQL 正则表达式似乎缺乏)。
java - 支持哪些内置正则表达式字符类 Java
...当用于"\\p{someCharacterClass}"
.
我用过/看过一些:
- 降低
- 上
- 组合变音符号
- ASCII
所有受支持的内置字符分类的最终列表是什么?它记录在哪里?具体含义是什么?
已编辑...
似乎有很多“RTFM”答案是指Pattern
. 这是我在问这个问题之前看到的第一个地方。大家都很清楚,Pattern 的 javadoc 没有提到上面列出的任何类。
“正确”答案将在页面某处提及“InCombiningDiacriticalMarks”,而不是对“Unicode 标准”的模糊引用。
regex - 让 awk 使用字符类
如何让 awk 识别字符类?
例如,这个:
按预期输出1
,但是:
在我期望的地方没有输出任何东西,1
并且2
在过滤器中存活下来。
我认为这可能与外壳转义(zsh)有关,但awk '/\\d/'
也不起作用。
java - Java - 静态定义的字符列表
在任何标准库中是否有字符类(字母、数字、字母数字)的定义?我正在检查字符串是否仅包含字母数字字符或冒号:
我可以自己定义 ALPHA_NUMERIC,但似乎通用字符类将在标准库中定义,尽管我一直无法找到定义。
编辑:我确实考虑过正则表达式,但对于我的特定用例,执行时间很重要,简单的扫描更有效。
编辑:这里是使用 Regex、CharMatcher 和简单扫描的测试结果(对每个测试使用相同的一组有效/无效输入字符串):
有效输入字符串:
CharMatcher,运行次数:1000000,有效字符串:true,时间(毫秒):1200
正则表达式,运行次数:1000000,有效字符串:true,时间(毫秒):909
扫描,运行次数:1000000,有效字符串:true,时间(毫秒):96
无效的输入字符串:
CharMatcher,运行次数:1000000,有效字符串:false,时间(毫秒):277
正则表达式,运行次数:1000000,有效字符串:false,时间(毫秒):253
扫描,运行次数:1000000,有效字符串:false,时间(毫秒):36
这是执行扫描的代码:
编辑:我重新编译为一个独立的程序(我正在通过 eclipse 运行):
CharMatcherTester,运行次数:1000000,有效字符串:true,时间(毫秒):418
RegexTester,运行次数:1000000,有效字符串:true,时间(毫秒):812
ScanTester,运行次数:1000000,有效字符串:true,时间(毫秒):88
CharMatcherTester,运行次数:1000000,有效字符串:false,时间(毫秒):142
RegexTester,运行次数:1000000,有效字符串:false,时间(毫秒):223
ScanTester,运行次数:1000000,有效字符串:false,时间(毫秒):32
来源:https ://bitbucket.org/jdeveloperw/testing (这是我第一次将测试结果发布到 SO,因此感谢您的评论。)
java - Groovy Regex:字符类中的波浪号有什么作用?
我有这个来自 groovy 代码的正则表达式:
我唯一不明白的是这部分:
波浪号在那里做什么?这是一个错误吗?或者只是角色类的一些开关?
我的理解是第一行和第三行确实匹配单词边界,而第二行匹配有问题的文本(长短形式)。
我尝试用谷歌搜索(当然在这里搜索)但不幸的是,该图块属于 groovy 中的“匹配这个”运算符,所以我在这里找到的所有内容都是关于如何正则表达式的一般信息。
ruby - 为什么我看到这两个几乎相同的 Ruby 正则表达式模式的结果不同,为什么一个匹配我认为它不应该匹配的结果?
使用 Ruby 1.9.2,我在 IRB 中有以下 Ruby 代码:
这将产生以下输出:
1.) 为什么结果不同?
2.) 为什么会r1
在字符串 2、3 和 4 上匹配?(?=.*[\W])
由于这些示例中没有任何非单词字符,因此前瞻性不会导致它失败吗?
python - 正则表达式:字符类中的 \Z
正则表达式:
它应该捕获以字符串或字符串blah
结尾@
或结尾的符号符号。\Z
在字符类中包含正确的技术吗?
xml - 正则表达式 \p{L} 和 \p{N}
我是正则表达式的新手,并获得了以下正则表达式:
我知道 * 是什么意思和 | 表示“或”,而 \ 转义。
但我不知道什么\p{L}
和\p{N}
意味着什么。我用谷歌搜索了它,没有结果......
有人能帮我吗?
regex - php preg_match 使用速记和字符类相结合
当明显有字符匹配范围“[AZ]”时,它如何显示0?
它是解析发生的方式吗?
ruby - 如何为字母、元音和辅音等德语字符类编写正则表达式?
例如,我设置了这些:
所以/(#{K}#{V}{2})/
匹配"ßäÜ"
在"azAZßäÜ"
.
有没有更好的方法来对付它们?
我可以将这些常量放在我的 Ruby 安装文件夹中某个文件的模块中,这样我就可以在我在计算机上编写的任何新脚本中包含/要求它们吗?(我是新手,我知道我混淆了这个术语;请纠正我。)
此外,我可以只让元字符\L
,\V
和\K
(或任何尚未在 Ruby 中设置的)在正则表达式中代表它们,所以我不必一直做字符串插值吗?