问题标签 [www-mechanize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
579 浏览

perl - 使用 WWW::Selenium 保存文件

我试图用 perl 的 WWW::Selenium 下载一个文件。我收到一个弹出框,询问我是否要保存/打开文件。我想操纵它并在某个给定位置说“保存”。我不确定如何做到这一点。请帮忙。

PS:我不能在这个页面上使用 WWW::Mechanize,我必须使用 Selenium

非常感谢!

0 投票
2 回答
3150 浏览

perl - 如何找到 perl 打印的“宽字符”?

从网站抓取静态 html 页面并将它们写入单个文件的 perl 脚本似乎可以工作,但也会打印许多实例wide character in print at ./script.pl line n到控制台:每个抓取的页面都有一个。

然而,对生成的 html 文件的简要浏览并没有发现任何明显的抓取错误。如何找到/修复问题字符?我什至应该关心修复它吗?

相关代码:

这是在带有 Perl 5.8.8 的 OSX 上。

0 投票
2 回答
896 浏览

perl - 使用 Perl 访问 50 万页

目前我正在使用 Mechanize 和 get() 方法来获取每个站点,并使用 content() 方法检查每个主页的某些内容。我有一台非常快的计算机 + 10Mbit 连接,但检查 11K 站点仍需要 9 个小时,这是不可接受的,问题是 get() 函数的速度,显然需要获取页面,有什么方法可以让它更快,也许禁用某些东西,因为我只需要检查主页 html。

谢谢,

0 投票
2 回答
2349 浏览

perl - 为什么 WWW::Mechanize GET 某些页面而不是其他页面?

我是 Perl/HTML 的新手。我正在尝试从http://en.wikipedia.org/wiki/Periodic_table$mech->get($url)上的元素周期表中获取一些东西,但它一直返回如下错误消息:

获取http://en.wikipedia.org/wiki/Periodic_table时出错 :PeriodicTable.pl 第 13 行禁止

但如果是http://search.cpan.org/$mech->get($url) ,效果很好。$url

任何帮助都感激不尽!


这是我的代码:

0 投票
1 回答
939 浏览

html - 从 HTML 页面中提取所有链接,从特定表中排除链接

我对 Perl/HTML 很陌生。这是我要对WWW::MechanizeHTML::TreeBuilder做的事情:

对于 Wikipedia 上的每个化学元素页面,我需要提取指向 wiki 上其他化学元素页面的所有超链接,并以这种格式打印每个唯一对:

唯一的问题是每个化学元素的页面(页面右上角)都有一个迷你元素周期表。因此,这个微小的元素周期表只会使每个元素的结果都相同。我在从该表中提取页面中的所有链接时遇到问题。

$elem == 6[注意:为了便于调试, 我只查看了(Carbon) (@line 42)。]


这是我的代码:

0 投票
1 回答
1363 浏览

perl - 为什么 WWW::Mechanize 找不到正确的形式?

我正在使用 WWW::Mechanize 从网页中检索表单:

网站HTML代码如下

但我得到了错误

我该怎么办?

0 投票
1 回答
1324 浏览

perl - 如何在 Perl 的 WWW::Mechanize 中使用 Web 代理?

我正在尝试将 WWW::Mechanize 与代理服务器一起使用,但似乎我无法让它工作。由于 Mechanize 是 LWP::UserAgent 的子类,我一直在阅读有关 链接文本的代理内容

我有一个代理列表,例如:

我不知道如何使用它们。

谢谢,

0 投票
1 回答
286 浏览

perl - 如何使用 Perl 的 WWW::Mechanize 检查网页是否已更新?

我正在使用 WWW::Mechanize 来检索网页。我需要检查页面是否已更新并从中检索信息。我怎样才能做到这一点?

0 投票
4 回答
1794 浏览

perl - 如何使用 Perl 的 WWW::Mechanize 从超时中恢复?

我正在使用 WWW::Mechanize 在每隔几秒运行一次的循环中读取特定网页。有时,“GET”超时并且脚本停止运行。如何从这样的超时中恢复,以便它继续循环并在下一次尝试“GET”?

0 投票
1 回答
1904 浏览

perl - 如何使用 WWW::Mechanize 来检查单选框?

我正在编写一个 Perl 脚本来测试我的网页的某些部分,因为我对其进行了更改。使用 WWW::Mechanize 类,如何选择单选框并提交表单?