问题标签 [html-treebuilder]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
53 浏览

perl - Perl HTML::Element 如何向下查找以在匹配标记之后提取下一个标记

我正在使用 HTML::TreeBuilder 来处理 HTML 文件。在这些文件中,我可以有定义列表,其中有术语“数据库”和定义“数据库名称”。模拟的 html 如下所示:

我需要确定文件来自哪个数据库并返回值。

say $dlist->right()->as_text;当我在其中识别出“数据库:”时,我希望能够说出类似<dt>的话,但我不知道该怎么做。您的想法将不胜感激。

0 投票
3 回答
675 浏览

python - bs4.FeatureNotFound:找不到具有您请求的功能的树生成器:html-parser。您需要安装解析器库吗?

我试图通过以下代码进行网页抓取:

但不断收到以下错误:

我安装了lxml 和 html5lib这个问题仍然存在。

0 投票
2 回答
145 浏览

html - 在 Perl 中使用 HTML::TreeBuilder 提取特定跨度类的所有实例

试图制作一个 Perl 脚本来打开一个 HTML 文件并提取<span class="postertrip">标签中包含的任何内容。

示例 HTML:

期望的输出:

当前脚本:

脚本输出错误: