我想知道是否有人使用 Puppeteer-Cluster 可以详细说明 Cluster.Launch({settings}) 如何防止在不同上下文中的页面之间共享 cookie 和 Web 数据。
这里的浏览器上下文是否实际上阻止了 cookie 并且不共享或跟踪用户数据?Browserless' 现在臭名昭著的页面似乎认为不,这里应该在任务上调用 .launch({}) ,而不是在队列之前调用。
所以我的问题是,我们如何知道 puppeteer-cluster 是否在队列任务之间共享 cookie/数据?库中有哪些选项可以降低被标记为机器人的机会?
设置:我正在将 page.authenticate 与代理服务、随机用户代理一起使用,但我正在执行测试的站点偶尔仍会被阻止(403)。
async function run() {
// Create a cluster with 2 workers
const cluster = await Cluster.launch({
maxConcurrency: 2, //5, //25, //the number of chromes open
monitor: false, //true,
puppeteerOptions: {
args: [
headless: false,
sameDomainDelay: 1000,
retryDelay: 3000,
workerCreationDelay: 3000
// Define a task
await cluster.task(async ({ page, data: url }) => {
extract(url, page); //call the extract
const extract = async ({ page, data: dataJson }) => {
await page.authenticate({
username: proxy_user,
password: proxy_pass
//Randomized Delay
await delay(2000 + (Math.floor(Math.random() * 998) + 1));
const response = await page.goto(dataJson.Url);
//loop over inputs, and queue them into cluster
var dataJson = {
url: url
cluster.queue(dataJson, extract);
// Shutdown after everything is done
await cluster.idle();
await cluster.close();