问题标签 [www-mechanize]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

369 问题

0 投票

2 回答

579 浏览

perl - 使用 WWW::Selenium 保存文件

我试图用 perl 的 WWW::Selenium 下载一个文件。我收到一个弹出框，询问我是否要保存/打开文件。我想操纵它并在某个给定位置说“保存”。我不确定如何做到这一点。请帮忙。

PS：我不能在这个页面上使用 WWW::Mechanize，我必须使用 Selenium

非常感谢！

perl selenium www-mechanize

2010-07-12T17:09:10.220

0 投票

2 回答

3150 浏览

perl - 如何找到 perl 打印的“宽字符”？

从网站抓取静态 html 页面并将它们写入单个文件的 perl 脚本似乎可以工作，但也会打印许多实例wide character in print at ./script.pl line n到控制台：每个抓取的页面都有一个。

然而，对生成的 html 文件的简要浏览并没有发现任何明显的抓取错误。如何找到/修复问题字符？我什至应该关心修复它吗？

相关代码：

这是在带有 Perl 5.8.8 的 OSX 上。

perl unicode screen-scraping www-mechanize

2010-07-29T16:44:07.957

0 投票

2 回答

896 浏览

perl - 使用 Perl 访问 50 万页

目前我正在使用 Mechanize 和 get() 方法来获取每个站点，并使用 content() 方法检查每个主页的某些内容。我有一台非常快的计算机 + 10Mbit 连接，但检查 11K 站点仍需要 9 个小时，这是不可接受的，问题是 get() 函数的速度，显然需要获取页面，有什么方法可以让它更快，也许禁用某些东西，因为我只需要检查主页 html。

谢谢，

perl web-crawler www-mechanize

2010-09-10T06:58:51.880

0 投票

2 回答

2349 浏览

perl - 为什么 WWW::Mechanize GET 某些页面而不是其他页面？

我是 Perl/HTML 的新手。我正在尝试从http://en.wikipedia.org/wiki/Periodic_table$mech->get($url)上的元素周期表中获取一些东西，但它一直返回如下错误消息：

获取http://en.wikipedia.org/wiki/Periodic_table时出错：PeriodicTable.pl 第 13 行禁止

但如果是http://search.cpan.org/$mech->get($url) ，效果很好。$url

任何帮助都感激不尽！

这是我的代码：

perl www-mechanize

2010-09-11T10:45:19.673

0 投票

1 回答

939 浏览

html - 从 HTML 页面中提取所有链接，从特定表中排除链接

我对 Perl/HTML 很陌生。这是我要对WWW::Mechanize和HTML::TreeBuilder做的事情：

对于 Wikipedia 上的每个化学元素页面，我需要提取指向 wiki 上其他化学元素页面的所有超链接，并以这种格式打印每个唯一对：

唯一的问题是每个化学元素的页面（页面右上角）都有一个迷你元素周期表。因此，这个微小的元素周期表只会使每个元素的结果都相同。我在从该表中提取页面中的所有链接时遇到问题。

$elem == 6[注意：为了便于调试，我只查看了(Carbon) (@line 42)。]

这是我的代码：

html perl perl-module www-mechanize

2010-09-13T19:30:20.890

0 投票

1 回答

1363 浏览

perl - 为什么 WWW::Mechanize 找不到正确的形式？

我正在使用 WWW::Mechanize 从网页中检索表单：

网站HTML代码如下

但我得到了错误

我该怎么办？

perl www-mechanize

2010-09-14T12:01:38.217

0 投票

1 回答

1324 浏览

perl - 如何在 Perl 的 WWW::Mechanize 中使用 Web 代理？

我正在尝试将 WWW::Mechanize 与代理服务器一起使用，但似乎我无法让它工作。由于 Mechanize 是 LWP::UserAgent 的子类，我一直在阅读有关链接文本的代理内容

我有一个代理列表，例如：

我不知道如何使用它们。

谢谢，

perl proxy www-mechanize

2010-09-15T08:18:17.690

0 投票

1 回答

286 浏览

perl - 如何使用 Perl 的 WWW::Mechanize 检查网页是否已更新？

我正在使用 WWW::Mechanize 来检索网页。我需要检查页面是否已更新并从中检索信息。我怎样才能做到这一点？

perl www-mechanize

2010-09-16T09:01:08.020

0 投票

4 回答

1794 浏览

perl - 如何使用 Perl 的 WWW::Mechanize 从超时中恢复？

我正在使用 WWW::Mechanize 在每隔几秒运行一次的循环中读取特定网页。有时，“GET”超时并且脚本停止运行。如何从这样的超时中恢复，以便它继续循环并在下一次尝试“GET”？

perl www-mechanize

2010-09-22T05:07:41.130

0 投票

1 回答

1904 浏览

perl - 如何使用 WWW::Mechanize 来检查单选框？

我正在编写一个 Perl 脚本来测试我的网页的某些部分，因为我对其进行了更改。使用 WWW::Mechanize 类，如何选择单选框并提交表单？

perl radio-button www-mechanize

2010-09-23T20:08:47.740

1 2 3 4 5 6 7 8 9 10