我正在开发一个需要我解析网络上的 html 网站的小应用程序。我的问题如下:解析例程对于某些信息工作正常但我正在寻找几个小时来获取一些拒绝出现的信息的方法。
这是我愿意解析的部分代码结构:
<body>
`<header>
<nav>
<div.....>
<aside......>
<main>
<div .....>
<a ......>
<a ......>
</div>
.
.
.
<div id="general">
<h2> ........</h2>
<p>
<span class="label">text</span>
"text 2 to be parsed"
<br>
<span class="label">other text</span>
"text 3 to be parsed"
<br>
只是结构的一个例子,确切地说,网址是http://www.ourairports.com/airports/EBBR/pilot-info.html
好的,似乎 html 代码没有出现在预览中,所以在上面页面的源代码中,当你看到 [div id="general"] 时,下面有一个 [p] 后跟 [span class="label "]some text[/span] 并且在括号下方有文本。这发生在几行上,我需要捕捉这些信息。
我试过: //body/div/main/div[@id='general']/p as XpathQueryString 但结果是 1 个节点并且为空
也有 div[@id='general'] 但结果没有找到节点,有 div[@id='general']/p/span 结果没有找到节点,有 //div/p/span[@class= 'label'] 结果是标志和 >/span> 之间的标题,但我希望检索后面引号之间的文本,但我无法弄清楚如何成功。我想我已经尝试了所有组合(除了上面解释的很多其他组合)但没有机会。是否有特殊的路径可以访问此文本?
感谢您的建议。
顺便说一句,这是我在 stackoverflow.com 上的第一篇文章,我的第一语言是法语,所以对于任何不遵守的规则或我的英语不好,我提前道歉。
在键盘上享受您的白天、晚上、……夜晚。
阿兰