问题标签 [html-tree]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
56 浏览

arrays - 更新:编辑哈希数组内容

在我的数组中,我有一些看起来像这样的东西;也就是说,格式是这样的:

Monday, June 12

我想摆脱

Monday,<--- nb : 这个逗号后面有一个空格。

部分。我习惯做的只是对标签进行正则表达式,然后像这样过滤它们:

这给了我一个想法。我以为我可以这样做,但是用符号稍微修改一下代码

->as_text

[$i]

不知何故洒在周围。不知道如何。也许有一个明显的方法可以更有效地做到这一点......这是先生的背景故事@bad_array

哦,还有,这就是@bad_array最终发生的事情:


也许可以修改:


是这个吗?

还是这个?

(来源:http ://www.perlmonks.org/?node_id=477712 )

也许这个?

哪里my %hash = @bad_array;,对吧?不,那不可能,那是在使用副本...


结果如下:

0 投票
1 回答
64 浏览

regex - 提取某种形式的所有链接

我有一个页面,我想要关闭所有链接(例如 http://www.stephenfry.com/)。我想将所有形式为http://www.stephenfry.com/WHATEVER的链接放入一个数组中。我现在得到的只是以下方法:

不知道如何只放入这些链接。

0 投票
1 回答
193 浏览

regex - 如何将look_down树数组的HTML标记中的值放入Perl中的常规数组中?

这是我得到的一段代码:

我知道有更简单的方法可以做到这一点 - 随意谈论这些方法,但我现在正在这样做。我想将所有value条目放入一个数组中,例如,如果我的(我所称的)look_down 树数组元素之一如下

<option value="YIDDSH">Yiddish</option>,

然后我想以某种方式将“YIDDSH”(不带引号)推入一个数组,并从数组中的下一个元素中拉入下一个值。

0 投票
1 回答
376 浏览

perl - 在 Perl 中,如何将文件中的 URL 列表流式传输到数组中,然后递归地在单个文件中获取它们的所有 HTML 数据?

另一个费力的标题...对不起...无论如何,我有一个文件mash.txt,其中包含一堆这样的 URL:

http://www...

http://www...

http://www...

.

.

.

所以,在这一点上,我想将这些(URL)输入到一个数组中——可能不需要在此过程中声明任何东西——然后递归地从每个数组中提取 HTML 数据并将其全部附加到同一个数组中文件——我想必须创建它......无论如何,提前谢谢。


实际上,为了完全实现,按照设计,我想将每个 HTML 标记中的标记value下的值 ( )option与该文档相匹配,所以我没有那些垃圾......

http://www...

会产生这样的东西

所有这些我想要的只是valueoption这个mash.txt.

0 投票
2 回答
54 浏览

perl - 带有哈希枚举的 Suckerupper

我有一些我的朋友帮助创建的代码:

我无法理解线路3345正在做什么。我认为在大多数情况下,我得到了其他所有东西在做的事情,即将@selects网站上的主 .aspx 文件中的两个选择标签中包含的所有内容都放在了考虑范围内——我认为大小@selects是 2。我也得到了从这一点开始,第 0 个插槽@selects被传递到@quarters中,同样,位置 1 插槽被传递到 @courses。每场独特的比赛都会被列举出来,n全年提供的课程总数也是如此。现在,我没有得到 $hash_count 正在枚举的内容。我怀疑这是提供的独特课程的数量,所以n类似于动物的地方(在伪代码中)

我怀疑hash_count是一种动物

正确的?

0 投票
1 回答
97 浏览

python - 使用 RegEx 结合 HTML::TreeBuilder 匹配多个“id”值

我有一个数组中的 URL 列表:

我们来看第一页的内容,即doc1.html:

现在,让我们查看第二页的内容,即 doc2.html:

doc3.html 的值将具有相同abc123.....xyz789的模式类型,ìd我的数组中的其余页面也是如此。我想捕捉每一个的文本内容。每个文档中只有一个id具有这种特定模式的值。当然,实际上id整个文档都有多个值,但是——为了简单起见——我们可以忽略这一点。


大图:我想把每场比赛都像这样:

0 投票
1 回答
221 浏览

perl - 如何使用 HTML::Tree 获取 HTML 标签的值?

假设我有一个数组,其中包含 body 标记的内容,如下所示: print Dumper(\@array);

假设我想从@array 的内容中获取“div”标签的 id:

我这样做:

这适用于属性只有一个值的情况。但是我如何从@array 中的脚本标签中获取 866346569493123700 呢?

对此的任何帮助将不胜感激,因为我已经尝试了几个小时

0 投票
2 回答
878 浏览

perl - HTML::Tree: 不能在未定义的值上调用方法“as_text”

我正在使用 HTML::TreeBuilder 解析房地产网页,并具有以下代码:

某些页面不包含城市或州,解析器退出并出现错误:

为了修复它,我使用了以下方法:

它可以工作,但现在我有 9 行而不是 1 行。由于我有很多这样的地方,代码会变得相当大。

有什么办法可以优化吗?

0 投票
2 回答
96 浏览

perl - Xpath won't fiind id

I'm failing to get a node by its id. The code is straight forward and should be self-explaining.

The code above prints:

How can I select a node by its ID?

Thanks in advance.

0 投票
1 回答
63 浏览

save - 通过将网页另存为“网页完成”进行静态更改

我使用 Firefox 33.0 将网站保存为“Web Page, Complete”。

问题是,主 html 文件的 html 树是静态更改的。在保存之前有这样的东西:

保存后如下图:

我试过谷歌浏览器和 IE。同样的事情。

如果我将其另存为“网页,仅 HTML 页面”,则 html 树已正确保存。

可能是什么问题?

先感谢您。