嗨,我试图让 RegEx 工作。我有这段文字:
/Ffont2 45.83 Tf 252 980 Td (XX7445 DDA PURCHASE 05/28 04:48
MCDONALD'S F561 CHICAGO IL 105/29 10.25) Tj ET
0.000000 0.000000 0.000000 rg 0.000000 0.000000 0.000000 RG BT /Ffont2 45.83 Tf 252 937 Td ( 12333378 214904443) Tj ET
0.000000 0.000000 0.000000 rg 0.000000 0.000000 0.000000 RG BT /Ffont2 45.83 Tf 252 894 Td (CITI CARD ONLINE PAYMENT 12345678 05/29 87.99) Tj ET
0.000000 0.000000 0.000000 rg 0.000000 0.000000 0.000000 RG BT /Ffont2 45.83 Tf 252 851 Td (XX7445 DDA PURCHASE 0528 14:11 #03632 JEWEL CHICAGO IL 0529 97.60) Tj ET
我试图让一切 从Td
喜欢Tj
Td (CITI CARD ONLINE PAYMENT 12345678 05/29 87.99) Tj
但是如果它们没有日期,我想跳过它们(必须有正斜杠),它们必须有金额(必须有期限),如果里面有“购买”这个词,我不想要它。所以
Td (XX7445 DDA PURCHASE 0528 14:11 #03632 JEWEL CHICAGO IL 0529 97.60) Tj
不会被退回。现在我有
(Td \()([^\)]*)([^\)]*)([/][^\)]*[.][^\)]*\) Tj)
对于我的正则表达式,它得到了一切,但即使它有“购买”,它也会得到它