问题标签 [headless-browser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 我将如何为 Windows 构建节点嵌合体?
我有 Windows 7,并且对使用节点嵌合体感兴趣。
https://github.com/deanmao/node-chimera
他们没有适用于 Windows 的二进制文件,我如何自己构建它并将其安装到NPM中?
我有视觉工作室 2012
(我标记了 c++,因为我认为 chimera 是用 c++ 构建的,但我从未编译过 c++ 应用程序)
javascript - 从脚本/命令行执行浏览器页面/javascript
希望这不是一个愚蠢的问题。
我最近对一件我非常好奇的事情有了一个想法。
我是 Node.js 的粉丝(我认为在这里并不相关)和 V8 引擎,但我想知道它是否可以运行浏览器(让它执行 JS)但在内部。
我的意思是创建一个程序(可能使用 V8 引擎),它可以打开一个页面(就像在浏览器中一样)并执行它的 javascript。
例如说我有以下文件托管在 www.mysite.co.uk/home.php
ping.php 看起来像:
假设我想通过在我的命令行/linux 框中使用某种脚本来执行 Javascript(基本上不使用浏览器)。
所以像:
甚至:
我觉得这应该是可能的,因为 V8(或不同的 JS 引擎)在技术上应该能够执行 Javascript,但我不知道它是如何在浏览器上下文之外执行的(或者即使它可能)。
有任何想法吗?
java - 使用Java从网页中抓取数据?
我正在为我的一个班级创建一个 twitter 机器人来练习使用队列并建立我的简历。
我希望机器人从 paper.li 时事通讯中抓取 Twitter 句柄,然后向用户发送推文。
这是一个示例网页。 http://paper.li/profkane/1335985326
我的推理,最初是抓取网页的链接,然后获取页面源,浏览它以找到@twitterhandle,然后将它们添加到队列中,以便稍后在构造消息时使用。
我查找了页面源,但在网页上的任何地方都找不到推特名称。这在Java中仍然可以做到吗?
c# - c# 无头浏览器,带有对爬虫的 javascript 支持
任何人都可以建议支持 cookie 和自动执行 javascript 的 .NET 无头浏览器吗?
javascript - 使用 CasperJS 的 Facebook 空屏幕截图
我正在使用SpookyJS(具有相同 API 的 CasperJS 的 nodejs 实现)导航到 facebook 的开发人员门户并返回我所有应用程序密钥和机密的列表。一切正常,直到我的代码将我带到developers.facebook.com/apps。一旦我点击该页面,屏幕截图 Spooky 会显示 facebook 页眉和页脚,但页面正文中没有显示任何内容,尽管它存在于我使用 Spooky 从页面下载的源代码中。有任何想法吗?
javascript - 如何在无头模式下运行浏览器(chrome、IE 和 firefox)?
我想将 JSTestDriver 与 jenkins-CI 集成。问题是构建服务器没有显示。有没有办法无头运行浏览器?
谢谢
testing - 重复“现在开始的异步会话清理阶段”
当我运行我的测试服时,我发现一些文本会间歇性地挂起很长时间(15 分钟到半小时),而 PhantomJS 会不断报告:
这是什么,是Asynchronous Sessions cleanup phase starting NOW
什么导致它挂了这么久?
干杯
戴夫
pdf-generation - HtmlUnit 并将页面另存为 PDF
在 Java EE 环境中,我想加载一个XML
和XSL
文件,将输出呈现到浏览器窗口,并将呈现的页面保存为 PDF。
我想以编程方式完成这一切。我正在寻找 HtmlUnit 以用作无头浏览器。这部分似乎有效,但 HtmlUnit 是否有任何 API 来调用“打印”函数或类似函数来持久化呈现的输出?我正在考虑某种方式将它与 iText 链接起来。
php - 如何通过 cron 作业运行(并杀死)无头浏览器以在 PHP 中自动抓取
我一直在尝试创建一个每天早上通过 cron 运行的蜘蛛。我想合并一个无头浏览器以获取渲染的 DOM(在 javascript 之后)。
我尝试使用Crowbar(一种无头浏览器)并成功通过 cURL 获得一个(也是唯一一个)页面。文档不存在,并且在每次第一次请求后都会挂起。
我如何通过 PHP 杀死 Crowbar 的进程,本质上是能够随意启动/停止它。还是人们只是让这些无头浏览器不断运行?这似乎是一种资源消耗。
这是我尝试过的代码,但终止进程不起作用。
或者有没有更好的方法用 javascript 在 php 中抓取?我很想听听...
javascript - 使用 casperjs fill() 和随机电子邮件地址填写注册表单
我对注册表单(姓名、电子邮件、密码)进行了测试,我希望它每次都使用随机生成的电子邮件地址,这样我就不必对测试进行任何清理或编辑. 我需要帮助文件还是可以在测试中完成?
我的片段看起来像这样——