问题标签 [pcregrep]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 正则表达式从给定关键字中查找数字的第一次出现
我有一个字符串
“ZTFN00识别号为89320394,手机号为+918017828848”
我想从关键字 ZTFN 中识别第一次出现的数字(在本例中为 89320394)。此外,表达式不应返回带有 ZTFN 的 00,并且只返回第一次出现的数字。
我试过\d+(?!ZTFN00)
了,但它不起作用!
请建议
regex - Bash: Regex matching on multiple lines simultaneously and extracting captured content
I have a xml file in following format
I want to extract all those name attributes of starttag whose any of the innertag has value YYY.
So in the file above, the output will be AAA and CCC. I can only use regex matching. I suppose it is possible using lookaheads but not able to create regex patterns for multilines. I know how to use regex for single line and I tried using same with this also but not getting expected outputs. Anyone any headway on this.
Edit: Though I have put xml example but actually I am trying to get to know multiline regex matching and I am trying on this file which I am failing. Please avoid XML parsing related solutions.
Update: As per Steven suggestion, following worked
c++ - Preg匹配所有在pcre c ++中
你好这是我的字符串
在php
我使用preg_match_all
( pcre
) 开始regex
进程
现在我在 c++ 上安装了 pcre,我想知道 c++ pcre 中究竟是什么进程等于我的 php 代码?像 php 一样工作的 c++ pcre 中到底有什么功能preg_match_all
?
grep - 为什么 pcregrep 比 grep 快?
我在 centos os 上有一些大文本文件(3 GB rails 日志文件),此文本文件中有损坏的字节。当尝试使用 grep 搜索某些模式时,它会无限期地运行,我必须关闭它,但是使用 pcregrep 只需不到一分钟,所以有什么线索为什么会有这种差异吗?
我使用 grep 搜索:
使用 pcregrep:
regex - 如何查找以文本开头的文件
我试着用
和
但是这个命令找到了文件,其中'asdasd'在行首,而不是所有文本,例如:
文件内容:
我只想查找具有此文件内容的文件:
(所有文本开头的asdasd)
regex - Bash:反引号内的正则表达式
我有一个名为“align_summary.txt”的文件,如下所示:
我想在 bash shell 中提取所有左对齐读取(在本例中为 2.1)中的多重对齐百分比。
如果我使用这个:
它立即给了我输出:2.1
但是,如果我将相同的表达式包含在这样的反引号中:
我收到一个错误:
据我了解,将此表达式括在反引号中会影响对包含“(”符号的正则表达式的解释,尽管它被反斜杠转义。
为什么会发生这种情况以及如何避免此错误?
我将不胜感激任何意见和建议。
非常感谢,
regex - 多行正则表达式 - 如何将行跳到最后一场比赛的末尾
因此,例如,我们在文件中有以下内容:
我需要提取每个日志条目中包含关键字“KEYWORD”的所有行。相应的正则表达式(使用 pcregrep)如下:
现在这工作得很好,并按预期打印以下内容:
那么怎么了?...好吧,我的理解是,正则表达式的工作原理是,在匹配该日志条目(第 1-4 行)之后,正则表达式引擎开始尝试从第 2 行再次匹配,因此正则表达式引擎不必要地遍历 2 行从第二个日志条目的开头开始匹配时的字符,这似乎是浪费时间 - 我们应该继续最后一次匹配结束的地方,即第 5 行。
我认为放置\G
在我的正则表达式的开头(在 之后(?s)
)可以解决这个问题,但事实并非如此。
有没有人有任何聪明的想法?
regex - 正则表达式跳过单词
我想使用正则表达式来提取字符串的前几个单词和倒数第二个字母。
例如,在字符串中
我想捕捉
也许与此类似
任何帮助将不胜感激。
sed - 在文本文件中剥离(ascii 装甲)PGP 块
给定一个格式为 markdown 的文件,偶尔会穿插 PGP 块,如何在 shell 脚本中使用标准 linux 工具去除 PGP 块?
该文件看起来像这个要点
(由于格式问题,我不得不创建一个要点)
php - 进入 php 正则表达式中的父块
您好,我有 2 个父(或更多...)块和其中的许多子块。
我想使用 php regex 并首先获取所有父块
但是这个正则表达式在到达第一个子块关闭时停止}
意味着第一个数据接收是
但我想得到这样的东西
我希望正则表达式传递子块[}]
并将所有内容都放在父块中。我的正则表达式是 PCRE (PHP)