我正在考虑改进。我目前正在对日志文件进行大量文本处理。
我并不是说 PCRE 慢/快或任何其他实现。
我编写的语言主要是 Perl。我知道它有一个强大的正则表达式引擎,而且我知道它比 PCRE 更具表现力。
我有这样的想法,即在 C++ 中制作一个小型正则表达式引擎,将正则表达式编译为原始 nasm。
我知道 PCRE 非常复杂,我的假设是我可以跳过 PCRE 在不必要的处理方面所做的很多事情。我当然可以让它比 Perl 更快,因为它使用类似 vm 的操作码和各种可以被认为是开销的东西。
前段时间我已经开始实施了。我不会在这里发布它,因为我没有任何问题,我可以将它执行到最后并获得一个能够进行捕获、能够解释+
*
^
$
、字符类的正则表达式引擎(虽然我还没有完成了我将正则表达式转换为汇编语言的部分)
这是个好主意还是坏主意?在达到良好性能方面会出现什么问题?
tl;dr => 可以生成本机程序集的 C++ 迷你正则表达式引擎比已建立的正则表达式实现更快吗?