如何提取所有字符(包括换行符),直到第一次出现给出的单词序列?例如使用以下输入:
输入文本:
"shantaram is an amazing novel.
It is one of the best novels i have read.
the novel is written by gregory david roberts.
He is an australian"
the
而我想从中提取文本shantaram
到第一次出现的序列the
在第二行。
输出必须是 -
shantaram is an amazing novel.
It is one of the
我整个上午都在努力。我可以编写表达式来提取所有字符,直到遇到特定字符,但如果我使用如下表达式:
re.search("shantaram[\s\S]*the", string)
它与换行符不匹配。