我正在使用来自getratings github 项目的基于 node.js 和 jsdom 的getratings.js脚本从NewEgg、BestBuy 等网站上抓取用户评论。
该脚本托管在 EC2 微实例上。在将超过 12 个同时请求发送到服务之前,它可以正常工作。除此之外,主机上的资源和内存利用率非常高,并且对客户端的响应需要很长时间。
我试图处理内存泄漏。一旦完成处理请求,内存使用量最终会下降,但使用峰值非常高。
我想知道我是否可以做一些事情来使通过 jsdom 处理 html 在资源利用方面更有效。