我知道 Pyppeteer 库和 Pyppeteer Stealth,但它们的问题是我试图从中抓取信息的网站检测到 Pyppeteer Stealth(Puppeteer 的 Python 移植)并阻止它。在 node JS 上使用的原始 Puppetetteer Stealth 在该网站上运行良好,但是,我更愿意在 Python 上创建这个爬虫,因为我更熟悉它。
还有哪些其他隐形和最新的无头浏览器自动化工具可用?
我所需要的只是抓取 HTML 内容并通过 Beautiful Soup 解析它。不幸的是,requests 和 requests-html 库在这个网站上也不起作用。