我正在尝试使用XPath
来提取一些 HTML 标签和数据,为此我需要使用XML::LibXML
模块。
我尝试从 CPAN shell 安装它,但它没有安装。
我按照 CPAN 站点的说明进行了安装,我们需要在安装libxml2
之前安装iconv
和zlib
包装器XML::LibXML
,但没有成功。
另外,如果有任何其他更简单的模块可以完成我的任务,请告诉我。
手头的任务:
我正在一个<dd>
非常大的 html 页面上搜索一个特定的标签(大约 5000 - 10000)<dd>
和<dt>
标签。所以,我正在编写一个脚本,它匹配<dd>
标签内的内容并获取相应(下一个)<dt>
标签内的内容。
我希望我能更清楚一点。任何帮助是极大的赞赏。