-4

我正在处理 pdf 文件转换。出于安全目的,我需要将原始金额值替换为其他值。但是在将 pdf 文件解析为普通文本文件时,所有内容都集中在一行中。因此,在解析过程中,我在每一行结尾 (\n) 中附加了一些符号,如“~~”。现在问题是字符像“~~”可能会在解析后出现在页面内容的任何部分。所以我需要回答才能在这个内容中执行正则表达式。但需要忽略页面中的字符“~~”。

例如:字符串“12”可能类似于下面显示的任何一个。
12
12~~
1~~2
1~~2~~
~~12
~~12~~
~~1~~2
~~1~~2~~ -->只是字符串与这个字符的排列。所以我想要一个匹配字符串“12”的正则表达式,尽管有排列或者只是忽略字符“~~”。

我想知道如何忽略该字符,而不是删除它。

大家好,我给了一个字符串“12”的例子,让你了解情况。下面的答案肯定会满足我给出的示例的要求,但这并不是我真正的意思......每个pdf的内容都会有所不同,pdf的内容是巨大的!!!即使我知道整个pdf的内容,只要假设我可以插入多少个地方(?:~~)?进入 :(!!!

4

2 回答 2

0

(〜*)?匹配所有示例字符串,例如 12 12~~ 1~~2 1~~2~~ ~~12 ~~12~~ ~~1~~2 ~~~1~~2~~ ab ab~~ a~~ b ~~ ~.(a~9

于 2013-07-05T05:55:50.077 回答
0
(?:~~)?1(?:~~)?2(?:~~)?

匹配所有示例字符串。这是你的意思吗?

解释:

  • (?:~~)将两个波浪号组合成一个(非捕获)组。
  • ?使该组可选。
于 2013-07-05T05:36:03.720 回答