问题标签 [html-tree]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
arrays - 更新:编辑哈希数组内容
在我的数组中,我有一些看起来像这样的东西;也就是说,格式是这样的:
Monday, June 12
我想摆脱
Monday,
<--- nb : 这个逗号后面有一个空格。
部分。我习惯做的只是对标签进行正则表达式,然后像这样过滤它们:
这给了我一个想法。我以为我可以这样做,但是用符号稍微修改一下代码
->as_text
和
[$i]
不知何故洒在周围。不知道如何。也许有一个明显的方法可以更有效地做到这一点......这是先生的背景故事@bad_array
:
哦,还有,这就是@bad_array
最终发生的事情:
也许可以修改:
是这个吗?
还是这个?
(来源:http ://www.perlmonks.org/?node_id=477712 )
也许这个?
哪里my %hash = @bad_array;
,对吧?不,那不可能,那是在使用副本...
结果如下:
regex - 提取某种形式的所有链接
我有一个页面,我想要关闭所有链接(例如 http://www.stephenfry.com/)。我想将所有形式为http://www.stephenfry.com/WHATEVER的链接放入一个数组中。我现在得到的只是以下方法:
不知道如何只放入这些链接。
regex - 如何将look_down树数组的HTML标记中的值放入Perl中的常规数组中?
这是我得到的一段代码:
我知道有更简单的方法可以做到这一点 - 随意谈论这些方法,但我现在正在这样做。我想将所有value
条目放入一个数组中,例如,如果我的(我所称的)look_down 树数组元素之一如下
<option value="YIDDSH">Yiddish</option>
,
然后我想以某种方式将“YIDDSH”(不带引号)推入一个数组,并从数组中的下一个元素中拉入下一个值。
perl - 在 Perl 中,如何将文件中的 URL 列表流式传输到数组中,然后递归地在单个文件中获取它们的所有 HTML 数据?
另一个费力的标题...对不起...无论如何,我有一个文件mash.txt
,其中包含一堆这样的 URL:
http://www...
http://www...
http://www...
.
.
.
所以,在这一点上,我想将这些(URL)输入到一个数组中——可能不需要在此过程中声明任何东西——然后递归地从每个数组中提取 HTML 数据并将其全部附加到同一个数组中文件——我想必须创建它......无论如何,提前谢谢。
实际上,为了完全实现,按照设计,我想将每个 HTML 标记中的标记value
下的值 ( )option
与该文档相匹配,所以我没有那些垃圾......
http://www...
会产生这样的东西
所有这些我想要的只是value
在option
这个mash.txt
.
perl - 带有哈希枚举的 Suckerupper
我有一些我的朋友帮助创建的代码:
我无法理解线路33
和45
正在做什么。我认为在大多数情况下,我得到了其他所有东西在做的事情,即将@selects
网站上的主 .aspx 文件中的两个选择标签中包含的所有内容都放在了考虑范围内——我认为大小@selects
是 2。我也得到了从这一点开始,第 0 个插槽@selects
被传递到@quarters
中,同样,位置 1 插槽被传递到 @courses。每场独特的比赛都会被列举出来,n
全年提供的课程总数也是如此。现在,我没有得到 $hash_count 正在枚举的内容。我怀疑这是提供的独特课程的数量,所以n
类似于动物的地方(在伪代码中)
我怀疑hash_count
是一种动物
正确的?
python - 使用 RegEx 结合 HTML::TreeBuilder 匹配多个“id”值
我有一个数组中的 URL 列表:
我们来看第一页的内容,即doc1.html:
现在,让我们查看第二页的内容,即 doc2.html:
doc3.html 的值将具有相同abc123.....xyz789
的模式类型,ìd
我的数组中的其余页面也是如此。我想捕捉每一个的文本内容。每个文档中只有一个id
具有这种特定模式的值。当然,实际上id
整个文档都有多个值,但是——为了简单起见——我们可以忽略这一点。
大图:我想把每场比赛都像这样:
perl - 如何使用 HTML::Tree 获取 HTML 标签的值?
假设我有一个数组,其中包含 body 标记的内容,如下所示: print Dumper(\@array);
假设我想从@array 的内容中获取“div”标签的 id:
我这样做:
这适用于属性只有一个值的情况。但是我如何从@array 中的脚本标签中获取 866346569493123700 呢?
对此的任何帮助将不胜感激,因为我已经尝试了几个小时
perl - HTML::Tree: 不能在未定义的值上调用方法“as_text”
我正在使用 HTML::TreeBuilder 解析房地产网页,并具有以下代码:
某些页面不包含城市或州,解析器退出并出现错误:
为了修复它,我使用了以下方法:
它可以工作,但现在我有 9 行而不是 1 行。由于我有很多这样的地方,代码会变得相当大。
有什么办法可以优化吗?
perl - Xpath won't fiind id
I'm failing to get a node by its id. The code is straight forward and should be self-explaining.
The code above prints:
How can I select a node by its ID?
Thanks in advance.
save - 通过将网页另存为“网页完成”进行静态更改
我使用 Firefox 33.0 将网站保存为“Web Page, Complete”。
问题是,主 html 文件的 html 树是静态更改的。在保存之前有这样的东西:
保存后如下图:
我试过谷歌浏览器和 IE。同样的事情。
如果我将其另存为“网页,仅 HTML 页面”,则 html 树已正确保存。
可能是什么问题?
先感谢您。