问题标签 [www-mechanize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
perl - 使用 WWW::Selenium 保存文件
我试图用 perl 的 WWW::Selenium 下载一个文件。我收到一个弹出框,询问我是否要保存/打开文件。我想操纵它并在某个给定位置说“保存”。我不确定如何做到这一点。请帮忙。
PS:我不能在这个页面上使用 WWW::Mechanize,我必须使用 Selenium
非常感谢!
perl - 如何找到 perl 打印的“宽字符”?
从网站抓取静态 html 页面并将它们写入单个文件的 perl 脚本似乎可以工作,但也会打印许多实例wide character in print at ./script.pl line n
到控制台:每个抓取的页面都有一个。
然而,对生成的 html 文件的简要浏览并没有发现任何明显的抓取错误。如何找到/修复问题字符?我什至应该关心修复它吗?
相关代码:
这是在带有 Perl 5.8.8 的 OSX 上。
perl - 使用 Perl 访问 50 万页
目前我正在使用 Mechanize 和 get() 方法来获取每个站点,并使用 content() 方法检查每个主页的某些内容。我有一台非常快的计算机 + 10Mbit 连接,但检查 11K 站点仍需要 9 个小时,这是不可接受的,问题是 get() 函数的速度,显然需要获取页面,有什么方法可以让它更快,也许禁用某些东西,因为我只需要检查主页 html。
谢谢,
perl - 为什么 WWW::Mechanize GET 某些页面而不是其他页面?
我是 Perl/HTML 的新手。我正在尝试从http://en.wikipedia.org/wiki/Periodic_table$mech->get($url)
上的元素周期表中获取一些东西,但它一直返回如下错误消息:
获取http://en.wikipedia.org/wiki/Periodic_table时出错 :PeriodicTable.pl 第 13 行禁止
但如果是http://search.cpan.org/$mech->get($url)
,效果很好。$url
任何帮助都感激不尽!
这是我的代码:
html - 从 HTML 页面中提取所有链接,从特定表中排除链接
我对 Perl/HTML 很陌生。这是我要对WWW::Mechanize和HTML::TreeBuilder做的事情:
对于 Wikipedia 上的每个化学元素页面,我需要提取指向 wiki 上其他化学元素页面的所有超链接,并以这种格式打印每个唯一对:
唯一的问题是每个化学元素的页面(页面右上角)都有一个迷你元素周期表。因此,这个微小的元素周期表只会使每个元素的结果都相同。我在从该表中提取页面中的所有链接时遇到问题。
$elem == 6
[注意:为了便于调试, 我只查看了(Carbon) (@line 42)。]
这是我的代码:
perl - 为什么 WWW::Mechanize 找不到正确的形式?
我正在使用 WWW::Mechanize 从网页中检索表单:
网站HTML代码如下
但我得到了错误
我该怎么办?
perl - 如何在 Perl 的 WWW::Mechanize 中使用 Web 代理?
我正在尝试将 WWW::Mechanize 与代理服务器一起使用,但似乎我无法让它工作。由于 Mechanize 是 LWP::UserAgent 的子类,我一直在阅读有关 链接文本的代理内容
我有一个代理列表,例如:
我不知道如何使用它们。
谢谢,
perl - 如何使用 Perl 的 WWW::Mechanize 检查网页是否已更新?
我正在使用 WWW::Mechanize 来检索网页。我需要检查页面是否已更新并从中检索信息。我怎样才能做到这一点?
perl - 如何使用 Perl 的 WWW::Mechanize 从超时中恢复?
我正在使用 WWW::Mechanize 在每隔几秒运行一次的循环中读取特定网页。有时,“GET”超时并且脚本停止运行。如何从这样的超时中恢复,以便它继续循环并在下一次尝试“GET”?
perl - 如何使用 WWW::Mechanize 来检查单选框?
我正在编写一个 Perl 脚本来测试我的网页的某些部分,因为我对其进行了更改。使用 WWW::Mechanize 类,如何选择单选框并提交表单?