构建一个匹配分层数据的单个正则表达式是否可能/实用?
例如:
<h1>Action</h1>
<h2>Title1</h2><div>data1</div>
<h2>Title2</h2><div>data2</div>
<h1>Adventure</h1>
<h2>Title3</h2><div>data3</div>
我想以比赛结束。
"Action", "Title1", "data1"
"Action", "Title2", "data2"
"Adventure", "Title3", "data3"
正如我所看到的,这需要知道这里有一个层次结构,如果我编码模式来捕获 H1,它只匹配该层次结构的第一个条目。如果我不为 H1 编码,那么我无法捕获它。想知道我是否有什么特殊的技巧可以解决这个问题。
这是一个 .NET 项目。