问题标签 [browser-automation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
910 浏览

c# - 在多线程中自动化 Web 浏览器控制

我想知道是否可以自动化 System.Windows.Forms.WebBrowser 并使其在多个线程中运行。

我的意思是我想登录说 mysite.com ,使用 5 个不同的帐户,是否可以同时使用 5 个线程中的 5 个 Web 浏览器同时与 mysite.com 的服务器保持单独的会话,

会话不会相互重叠吗?

编辑:多线程是指 5 个单独线程中的 5 个控制实例。我希望这能让 COM 组件问题变得清晰。

0 投票
1 回答
171 浏览

automation - Web 自动化的执行时间基准

是否有任何与自动化执行时间相关的行业标准/基准可用于在网页上执行不同的操作。就像通过自动化一样;多少时间可以被认为是为文本框设置值的可接受时间(如 20 个字符为 1 秒),或者点击按钮、从组合框中选择值、选择网格中可用的复选框等可以接受的时间范围。

0 投票
3 回答
2416 浏览

java - 如何通过java点击一个按钮?

我想通过 Java 编程语言访问 HTMl 页面上的表单,而不涉及真正的浏览器。

目前我正在通过HTML UNIT执行此操作,但加载页面需要更多时间。在访问数百万页时,这个额外的时间是最重要的。

有没有其他方法可以做到这一点?

0 投票
2 回答
2133 浏览

java - 如何在 IE (Internet Explorer) 上自动执行“另存为”?

我想打开一个网页(其 URL 作为命令行参数给出),然后想将该网页的内容保存为 .txt 文件。

请记住,我需要 .txt 文件而不是网页的来源。

我用硒尝试了我的手,效果很好。但是现在我想要一些不打开真正浏览器的东西,因为打开浏览器并在其中加载页面是一项耗时的任务。

我想用java来做。

内容是指我们在 IE 中保存网页时获得的文本(不带标记),方法是转到“另存为”,然后选择“.txt”作为文件的输出格式。

0 投票
2 回答
5752 浏览

javascript - 我可以覆盖/重新定义“全局”Javascript 函数,例如确认()和警报()吗?

我想做一些浏览器自动化,那些讨厌的确认/警报框真的很痛苦。不幸的是,在这种情况下完全禁用 javascript 不是一种选择。

好吧,所以我想知道,我可以将浏览器的 javascript 解释器看到的那些方法的定义更改为基本上什么都不做并返回 true 吗?请注意,我确实知道直接在 Javascript 代码中重新定义它们,例如放入

但是 AFAIK 对于这种情况,这不是一种可行的方法,因为在进行浏览器自动化时,我必须使用其他人的 Javascript。此外,我的程序实际上在页面完全加载到浏览器后就已经开始操作这些网站,所以我不能只是先自动重写 javascript 然后加载页面。好吧,所以我想知道是否可以“永久”修改在浏览器中实现和执行警报/确认的方式。有点像 Windows 应用程序领域中的 dll 注入等。

0 投票
1 回答
243 浏览

continuous-integration - webrat 浏览器自动化测试可以并行化吗?

是否有类似于 SeleniumGrid 的工具,我可以使用它来跨协调代理场并行运行 webrat(或其他类似框架)浏览器自动化测试?

通过 TeamCity 与 rake 协调?

编辑:我们正在考虑使用 cucumber+webrat 进行功能和验收测试,如测试 ASP.NET Web 应用程序中所述

0 投票
2 回答
1117 浏览

c++ - 我可以像在 IE 中使用 win32 COM 一样使用 XPCOM 创建和操作 Firefox 窗口吗?

使用 win32 COM,我创建了一个 Internet Explorer 实例并几乎完全通过我的 python 代码控制它(操作窗口、DOM 元素等)。更具体地说,使用 DispatchEx('InternetExplorer.Application')。我可以使用 XPCOM 和 C++/python 做同样的事情吗?

我需要自动化在某些网站的 html ui 上执行的某些操作,所以不,我不能使用 urllib 也不能使用 selenium,因为它不适用于跨域 url。我为 Internet Explorer 编写了一个包装类,我可以在其中创建一个浏览器窗口并用它做任何事情,但我也想用 firefox 做同样的事情。我考虑过创建一个 XUL 应用程序,该应用程序通过用 XUL/js 编写的 tcp 服务器公开 DOM 功能。我什至不确定这是否可能,但如果我可以从我的 python 代码中完成所有操作,而无需在外部运行 xulrunner,那就更好了。

0 投票
1 回答
166 浏览

firefox - 更新网页的脚本/插件(加载接下来的 25 条评论)直到页面完全加载

简要总结:我需要一个用于 Firefox 的脚本/插件,它选择网页底部的“加载下 25 条评论”链接,直到该链接不再出现在页面上。当您单击该链接时-您会收到更多评论-最终所有评论都在同一页面上。示例见此网页(有 1,852 条评论):http ://www.cnn.com/2010/US/05/16/gulf.oil.spill/index.html#comment-50598247


我经常遇到 CNN.com 的问题。我在那里发表评论。人们有时会回复他们。我检查了我的个人资料,并查看了回复的数量,但我无法在那里阅读它们。我必须按照原始文章的链接。第一组评论在底部,底部有一个“加载下一个 25”链接。通常有数百条评论,有时有几千条。我没有实用的方法来阅读对我的评论的回复。如果不到 30000 人,我只需点击该链接足够多次,即可查看对我的评论的回复。我需要一个脚本/插件来选择“加载下一个 25”链接,直到该链接不再出现在页面上。然后我可以搜索我的用户 ID 并阅读回复。

0 投票
2 回答
1351 浏览

c# - 包含 WebBrowser 的应用程序可以通过欺骗浏览器行为来自动控制下载文件吗?

假设我想从 url 自动下载一个文件,该文件位于需要身份验证的网站内,我使用基于 Internet Explorer 的自动 WebBrowser 控件登录到该网站。但是,一旦我在那里并获取文件的链接,如果我尝试通过导航到它直接通过 IE6 下载它,将会出现“你要打开还是保存这个文件”模式对话框。如果我尝试使用 C# WebClient 类下载它,它没有成功,下载的只是一小段无意义的 javascript。事实上,出于好奇,我测试了 Gmail 网站内的 WebClient 方法试图下载附件,但它也没有工作(我知道从 Gmail 中我可以通过 POP3 界面抓取它们,这只是一个实验)。

好吧,所以这让我想知道这一切的潜在机制。首先,也许我以错误的方式使用 WebClient ?或者在这种情况下可能有一些其他标准的 C# 类用于下载文件?

如果不是,应用程序是否有可能欺骗浏览器的行为,以便服务器认为文件请求来自它,即使它实际上来自同一进程的另一部分?在这种情况下,浏览器到底在做什么,让它下载文件而 WebClient 不能这样做?

0 投票
1 回答
151 浏览

flash - 在浏览器中运行的 SWF 应用程序是否可以像浏览器自动化一样被自动控制/蜘蛛化?

假设显示“仅供人类”信息的网站的所有者厌倦了抓取数据的机器人和蜘蛛,并决定在浏览器中运行的 SWF 应用程序中显示此信息。所以现在他将网站的结构重新实现为一个 Flash 应用程序,而坏人再也无法使用他们的 url-following、html-parsing 脚本来导航它。

坏人在这里能做什么?您能否制作一个在浏览器中运行的 Flash 应用程序,并以某种方式建立对在浏览器中运行的另一个 Flash 应用程序的控制,以便导航其用户界面并获取它向用户显示的文本?