我需要刮掉后面有 h3 标签但没有结束 p 标签的 ap 标签。它看起来像这样:
<script ad>asdasdasd</script>
<p>Translation companies are
-----------------------
-----------------------
<h3 class="this_class">mind blown site</h3>
没有 </p> 标记,所以我无法完全解析它。现在我有两个问题:
1)这可以使用 httpagility xpath 解析吗?
2)我有一个函数来查找两个字符串之间的文本(getbetween)。但我有一个疑问 - 如果我使用“asdasdasd”并且“vb.net 是否总是 100% 会使用 h3 上方的脚本标签,因为有 2-3 行相同的行 - “asdasdasd”
3)你们知道的任何其他方法吗?
(必须写在代码中,所以 html 不会搞砸)
问候,