“html-tree”的相关标签问题

0 投票

2 回答

56 浏览

arrays - 更新：编辑哈希数组内容

在我的数组中，我有一些看起来像这样的东西；也就是说，格式是这样的：

Monday, June 12

我想摆脱

Monday,<--- nb : 这个逗号后面有一个空格。

部分。我习惯做的只是对标签进行正则表达式，然后像这样过滤它们：

这给了我一个想法。我以为我可以这样做，但是用符号稍微修改一下代码

->as_text

和

[$i]

不知何故洒在周围。不知道如何。也许有一个明显的方法可以更有效地做到这一点......这是先生的背景故事@bad_array：

哦，还有，这就是@bad_array最终发生的事情：

也许可以修改：

是这个吗？

还是这个？

（来源：http ://www.perlmonks.org/?node_id=477712 ）

也许这个？

哪里my %hash = @bad_array;，对吧？不，那不可能，那是在使用副本...

结果如下：

2014-02-14T05:07:02.057

0 投票

1 回答

64 浏览

regex - 提取某种形式的所有链接

我有一个页面，我想要关闭所有链接（例如 http://www.stephenfry.com/）。我想将所有形式为http://www.stephenfry.com/WHATEVER的链接放入一个数组中。我现在得到的只是以下方法：

不知道如何只放入这些链接。

regex arrays perl html-tree

2014-02-16T01:14:57.350

0 投票

1 回答

193 浏览

regex - 如何将look_down树数组的HTML标记中的值放入Perl中的常规数组中？

这是我得到的一段代码：

我知道有更简单的方法可以做到这一点 - 随意谈论这些方法，但我现在正在这样做。我想将所有value条目放入一个数组中，例如，如果我的（我所称的）look_down 树数组元素之一如下

<option value="YIDDSH">Yiddish</option>,

然后我想以某种方式将“YIDDSH”（不带引号）推入一个数组，并从数组中的下一个元素中拉入下一个值。

regex arrays perl html-tree

2014-03-03T18:35:31.280

0 投票

1 回答

376 浏览

perl - 在 Perl 中，如何将文件中的 URL 列表流式传输到数组中，然后递归地在单个文件中获取它们的所有 HTML 数据？

另一个费力的标题...对不起...无论如何，我有一个文件mash.txt，其中包含一堆这样的 URL：

http://www...

.

所以，在这一点上，我想将这些（URL）输入到一个数组中——可能不需要在此过程中声明任何东西——然后递归地从每个数组中提取 HTML 数据并将其全部附加到同一个数组中文件——我想必须创建它......无论如何，提前谢谢。

实际上，为了完全实现，按照设计，我想将每个 HTML 标记中的标记value下的值 ( )option与该文档相匹配，所以我没有那些垃圾......

http://www...

会产生这样的东西

所有这些我想要的只是value在option这个mash.txt.

perl file stream append html-tree

2014-03-04T00:00:09.947

0 投票

2 回答

54 浏览

我无法理解线路33和45正在做什么。我认为在大多数情况下，我得到了其他所有东西在做的事情，即将@selects网站上的主 .aspx 文件中的两个选择标签中包含的所有内容都放在了考虑范围内——我认为大小@selects是 2。我也得到了从这一点开始，第 0 个插槽@selects被传递到@quarters中，同样，位置 1 插槽被传递到 @courses。每场独特的比赛都会被列举出来，n全年提供的课程总数也是如此。现在，我没有得到 $hash_count 正在枚举的内容。我怀疑这是提供的独特课程的数量，所以n类似于动物的地方（在伪代码中）

我怀疑hash_count是一种动物

正确的？

perl hash web-scraping web-crawler html-tree

2014-03-05T05:41:14.973

0 投票

1 回答

97 浏览

python - 使用 RegEx 结合 HTML::TreeBuilder 匹配多个“id”值

我有一个数组中的 URL 列表：

我们来看第一页的内容，即doc1.html：

现在，让我们查看第二页的内容，即 doc2.html：

doc3.html 的值将具有相同abc123.....xyz789的模式类型，ìd我的数组中的其余页面也是如此。我想捕捉每一个的文本内容。每个文档中只有一个id具有这种特定模式的值。当然，实际上id整个文档都有多个值，但是——为了简单起见——我们可以忽略这一点。

大图：我想把每场比赛都像这样：

python regex dictionary tree html-tree

2014-03-11T06:31:03.457

0 投票

1 回答

221 浏览

perl - 如何使用 HTML::Tree 获取 HTML 标签的值？

假设我有一个数组，其中包含 body 标记的内容，如下所示： print Dumper(\@array);

假设我想从@array 的内容中获取“div”标签的 id：

我这样做：

这适用于属性只有一个值的情况。但是我如何从@array 中的脚本标签中获取 866346569493123700 呢？

对此的任何帮助将不胜感激，因为我已经尝试了几个小时

perl cpan html-tree html-treebuilder

2014-03-16T10:57:13.667

0 投票

2 回答

878 浏览

perl - HTML::Tree: 不能在未定义的值上调用方法“as_text”

我正在使用 HTML::TreeBuilder 解析房地产网页，并具有以下代码：

某些页面不包含城市或州，解析器退出并出现错误：

为了修复它，我使用了以下方法：

它可以工作，但现在我有 9 行而不是 1 行。由于我有很多这样的地方，代码会变得相当大。

有什么办法可以优化吗？

perl optimization html-parsing html-tree

2014-09-06T20:52:02.093

0 投票

2 回答

96 浏览

perl - Xpath won't fiind id

I'm failing to get a node by its id. The code is straight forward and should be self-explaining.

The code above prints:

How can I select a node by its ID?

Thanks in advance.

perl xpath html-tree html-treebuilder

2014-09-13T16:17:33.980

0 投票

1 回答

63 浏览

save - 通过将网页另存为“网页完成”进行静态更改

我使用 Firefox 33.0 将网站保存为“Web Page, Complete”。

问题是，主 html 文件的 html 树是静态更改的。在保存之前有这样的东西：

保存后如下图：

我试过谷歌浏览器和 IE。同样的事情。

如果我将其另存为“网页，仅 HTML 页面”，则 html 树已正确保存。

可能是什么问题？

先感谢您。

save browser html-tree

2014-11-29T00:07:30.940

问题标签 [html-tree]

arrays - 更新：编辑哈希数组内容

是这个吗？

还是这个？

也许这个？

regex - 提取某种形式的所有链接

regex - 如何将look_down树数组的HTML标记中的值放入Perl中的常规数组中？

perl - 在 Perl 中，如何将文件中的 URL 列表流式传输到数组中，然后递归地在单个文件中获取它们的所有 HTML 数据？

perl - 带有哈希枚举的 Suckerupper

python - 使用 RegEx 结合 HTML::TreeBuilder 匹配多个“id”值

perl - 如何使用 HTML::Tree 获取 HTML 标签的值？

perl - HTML::Tree: 不能在未定义的值上调用方法“as_text”

perl - Xpath won't fiind id

save - 通过将网页另存为“网页完成”进行静态更改

问题标签 [html-tree]

是这个吗？

还是这个？

也许这个？

Reference