我正在寻找一个从以下格式获取所有数据的正则表达式:
">DATA<" returns "DATA"
"> DATA <" returns " DATA "
">.4930894812948cm <" returns ".4930894812948cm "
"> 939j@$%^^ < > << <" returns " 939j@$%^^ < > << "
">DATA< blah blah blah >DATA123< BLah >DATA456<" returns "DATA", "DATA123" and "DATA456"
(示例中的引号是为了使它们更易于阅读;它们不应出现在实际结果中。)
DATA 可以是任何编码
>DATA<
可以位于文本文件中的任何位置,因此可以一个接一个地重复。同样,所有数据是指所有数据,包括\n
, \r
, .
, 保留字符等。
我试过>(.*?)<
了,但没有用。
我正在用 Java 做这个。
添加另一个示例:
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Integer facilisis neque tellus, eget rhoncus sapien.
Pellentesque placerat purus non eros auctor ut consectetur magna bibendum.
Nam sollicitudin cursus >urna< nec varius.
Pellentesque elit augue, semper non porttitor nec, adipiscing ut ligula.
Cras accumsan >dolor< augue.
Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. >Sed< >rhoncus< ultrices elementum.
>lac
us<
Ut elementum condimentum est > pir. < feugiat.
应标记:
"urna"
"dolor"
"Sed"
"rhoncus"
"la
cus"
" pir. "
...包括它们之间的空格和行分隔符。希望这可以帮助。