我想基于正则表达式和java技术获取以下信息,其中开始标签是“FROM mail@mail.com Time”,结束标签是“FROM mail@mail.com Time”或字符串的结尾。结果应仅包含开始标记和开始和结束标记之间的内容,但不包含结束标记。背景是我想用正则表达式获取 mbox 格式的电子邮件。开始标记为“FROM mail@mail.com 时间”,邮件的结尾是下一封邮件的开头或文件的结尾。
所以我有以下架构:
FROM mail@mail.com Time
Text1
FROM mail@mail.com Time
Text2
FROM mail@mail.com Time
Text3
我的代码:
Pattern regex = Pattern.compile(Start_Tag+"(.*?)"+End_Tag,Pattern.DOTALL);
Matcher matcher = regex.matcher(mbox_content);
while (matcher.find())
{
System.out.println(matcher.group());
}
我用过这个,但它不起作用。有人可以支持我吗?提前致谢。