谁能告诉我什么是网络浏览器自动化的最佳框架/库?任务是打开 Web 浏览器页面、登录、执行一些长时间的搜索,并将收集到的信息保存到 Excel。现在我在 C# 中使用 IE 引用,但在工作中我只能使用 IE8。如果我已将其升级到 IE9,但目标站点上的一些脚本开始出现错误。
据我了解,我尝试使用 awesomium,但我无法在它的帮助下解析页面。是否有任何变体可以高速执行此操作?库的大小 - 没关系。
如果有任何与 Scala 兼容的解决方案,那就太好了。
谁能告诉我什么是网络浏览器自动化的最佳框架/库?任务是打开 Web 浏览器页面、登录、执行一些长时间的搜索,并将收集到的信息保存到 Excel。现在我在 C# 中使用 IE 引用,但在工作中我只能使用 IE8。如果我已将其升级到 IE9,但目标站点上的一些脚本开始出现错误。
据我了解,我尝试使用 awesomium,但我无法在它的帮助下解析页面。是否有任何变体可以高速执行此操作?库的大小 - 没关系。
如果有任何与 Scala 兼容的解决方案,那就太好了。
正如 om-nom-nom 已经暗示的那样,您最好的选择可能是像selenium webdriver这样的 webdriver 实现。它具有 c# 和 java 的绑定,并且可以使用 IE、FF、Chrome、phantomjs(如果你想去无头的话很好)和其他。
请注意,直接使用 webdriver 收集信息可能不是最好的主意,尤其是在站点内容快速变化的情况下。在这种情况下,使用 webdriver 保存 html 页面源代码然后切换到一些更有效的静态内容库(如JSoup )可能会很有用。