我有一堆 html 文件,我需要从中提取文本,而不是列表的内容。html就像
<html>
<Head>
<title>intranet mycompany</title>
</head>
<body>
<div>blah</div>
<p>the text i need to extract
<br>
<ul>
<li>stuff i don't want.</li>
<li>more stuff i don't want.</li>
</ul>More text i need to exctract.</p>
</body>
</html>
我真的想要一些关于如何从段落中获取文本的建议,而不是从列表中获取文本。任何建议都会受到重视。
问候,琼博。