感觉这应该是一项简单的任务,但不知何故无法将我的大脑包裹起来。我有带有 H1-H4 标题的 HTML 文件。我想获取 H3 标签之间的内容。不是两个 H3 之间的文本<H3>
,</H3>
而是两个 H3 之间的文本。
<H3>some text</H3>
<p> more text that I would like to grab</p>
<H3> some other text </H3>
<p> some more text that I'd like to get </p>
... 先感谢您
我被要求描述一个示例输出,我认为我在下面的评论中做了。我将重申相同的内容,如果有不清楚的地方,请告诉我。
输入:具有许多 H3 标题的长文件
输出:许多小文件,每个包含一个片段,该片段从包含 H3 标题的行开始,到下一个 H3 标题之前的行结束。