我可以使用 Xpath 或 CSS。
我试过:
my_page.xpath('//h4/p')
但这似乎只寻找p
属于h4
.
我正在解析的 HTML 结构如下所示:
<h4 class="ban">Mon May 28</h4>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043067349.html">.Net/Java Developers</a> - <font size="-1"> (phoenix )</font></p>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043066699.html">QA and Business Analysts</a> - <font size="-1"> (Phoenix Metro)</font></p>
页面上还有其他p
&a
元素......但基本上我想要做的是将h4
标签中的单词与页面上它之后的链接相关联(不嵌套在其中)。
谢谢。