现在,我们按照手动流程以 XML 格式下载 Amazon Associates 收益报告 ( https://affiliate-program.amazon.com/gp/associates/network/reports/report.html ),然后将该数据导入我们的应用程序.
如果可能,我们正在寻找可以自动下载该报告的解决方案,这样我们就不必手动单击“下载”按钮。
你能提出一些解决方案吗?
现在,我们按照手动流程以 XML 格式下载 Amazon Associates 收益报告 ( https://affiliate-program.amazon.com/gp/associates/network/reports/report.html ),然后将该数据导入我们的应用程序.
如果可能,我们正在寻找可以自动下载该报告的解决方案,这样我们就不必手动单击“下载”按钮。
你能提出一些解决方案吗?
我知道这是一个迟到的答案,但我问的是同样的问题。谷歌在第一页结果中提出了这个答案,也为 Node.js 开发人员提供了一个可以在这里工作的解决方案:
https://github.com/snd/amazon-associate
虽然我还没用过,但界面看起来超级干净简洁,看起来正是我想要的。希望它可以帮助其他人在 Node.js 上寻找解决方案。
我之所以遇到这个问题,是因为我正在寻找一个解决方案并使用 Selenium、Python 和 Firefox 构建它。
我已经使用Selenium WebDriver来解决自动化任务的不足curl
或wget
不足。它处理 cookie、JavaScript 执行以及抓取现代网页所需的所有其他小事情。它有用于从页面中提取信息的 CSS 选择器方法。
出于您的目的,只需使用Selenium IDE在浏览器中记录和回放下载,您可能会获得更快的时间。
我正在使用https://datagummy.com让我的会员报告可以通过 API 访问。
似乎他们正在处理所有抓取问题,包括验证码解决和电子邮件验证。
到目前为止,我还没有看到任何问题,并且服务按预期工作。