问题标签 [headless-browser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
289 浏览

c++ - 我将如何为 Windows 构建节点嵌合体?

我有 Windows 7,并且对使用节点嵌合体感兴趣。

https://github.com/deanmao/node-chimera

他们没有适用于 Windows 的二进制文件,我如何自己构建它并将其安装到NPM中?

我有视觉工作室 2012

(我标记了 c++,因为我认为 chimera 是用 c++ 构建的,但我从未编译过 c++ 应用程序)

0 投票
2 回答
3130 浏览

javascript - 从脚本/命令行执行浏览器页面/javascript

希望这不是一个愚蠢的问题。
我最近对一件我非常好奇的事情有了一个想法。
我是 Node.js 的粉丝(我认为在这里并不相关)和 V8 引擎,但我想知道它是否可以运行浏览器(让它执行 JS)但在内部。

我的意思是创建一个程序(可能使用 V8 引擎),它可以打开一个页面(就像在浏览器中一样)并执行它的 javascript。

例如说我有以下文件托管在 www.mysite.co.uk/home.php

ping.php 看起来像:

假设我想通过在我的命令行/linux 框中使用某种脚本来执行 Javascript(基本上不使用浏览器)。

所以像:

甚至:

我觉得这应该是可能的,因为 V8(或不同的 JS 引擎)在技术上应该能够执行 Javascript,但我不知道它是如何在浏览器上下文之外执行的(或者即使它可能)。

有任何想法吗?

0 投票
2 回答
1834 浏览

java - 使用Java从网页中抓取数据?

我正在为我的一个班级创建一个 twitter 机器人来练习使用队列并建立我的简历。

我希望机器人从 paper.li 时事通讯中抓取 Twitter 句柄,然后向用户发送推文。

这是一个示例网页。 http://paper.li/profkane/1335985326

我的推理,最初是抓取网页的链接,然后获取页面源,浏览它以找到@twitterhandle,然后将它们添加到队列中,以便稍后在构造消息时使用。

我查找了页面源,但在网页上的任何地方都找不到推特名称。这在Java中仍然可以做到吗?

0 投票
2 回答
12532 浏览

c# - c# 无头浏览器,带有对爬虫的 javascript 支持

任何人都可以建议支持 cookie 和自动执行 javascript 的 .NET 无头浏览器吗?

0 投票
0 回答
260 浏览

javascript - 使用 CasperJS 的 Facebook 空屏幕截图

我正在使用SpookyJS(具有相同 API 的 CasperJS 的 nodejs 实现)导航到 facebook 的开发人员门户并返回我所有应用程序密钥和机密的列表。一切正常,直到我的代码将我带到developers.facebook.com/apps。一旦我点击该页面,屏幕截图 Spooky 会显示 facebook 页眉和页脚,但页面正文中没有显示任何内容,尽管它存在于我使用 Spooky 从页面下载的源代码中。有任何想法吗?

0 投票
3 回答
10884 浏览

javascript - 如何在无头模式下运行浏览器(chrome、IE 和 firefox)?

我想将 JSTestDriver 与 jenkins-CI 集成。问题是构建服务器没有显示。有没有办法无头运行浏览器?

谢谢

0 投票
3 回答
7760 浏览

testing - 重复“现在开始的异步会话清理阶段”

当我运行我的测试服时,我发现一些文本会间歇性地挂起长时间(15 分钟到半小时),而 PhantomJS 会不断报告:

这是什么,是Asynchronous Sessions cleanup phase starting NOW什么导致它挂了这么久?

干杯

戴夫

0 投票
2 回答
2740 浏览

pdf-generation - HtmlUnit 并将页面另存为 PDF

在 Java EE 环境中,我想加载一个XMLXSL文件,将输出呈现到浏览器窗口,并将呈现的页面保存为 PDF。

我想以编程方式完成这一切。我正在寻找 HtmlUnit 以用作无头浏览器。这部分似乎有效,但 HtmlUnit 是否有任何 API 来调用“打印”函数或类似函数来持久化呈现的输出?我正在考虑某种方式将它与 iText 链接起来。

0 投票
1 回答
944 浏览

php - 如何通过 cron 作业运行(并杀死)无头浏览器以在 PHP 中自动抓取

我一直在尝试创建一个每天早上通过 cron 运行的蜘蛛。我想合并一个无头浏览器以获取渲染的 DOM(在 javascript 之后)。

我尝试使用Crowbar(一种无头浏览器)并成功通过 cURL 获得一个(也是唯一一个)页面。文档不存在,并且在每次第一次请求后都会挂起。

我如何通过 PHP 杀死 Crowbar 的进程,本质上是能够随意启动/停止它。还是人们只是让这些无头浏览器不断运行?这似乎是一种资源消耗。

这是我尝试过的代码,但终止进程不起作用。

或者有没有更好的方法用 javascript 在 php 中抓取?我很想听听...

0 投票
1 回答
1572 浏览

javascript - 使用 casperjs fill() 和随机电子邮件地址填写注册表单

我对注册表单(姓名、电子邮件、密码)进行了测试,我希望它每次都使用随机生成的电子邮件地址,这样我就不必对测试进行任何清理或编辑. 我需要帮助文件还是可以在测试中完成?

我的片段看起来像这样——