我正在使用刮刀,我想刮掉某些网站,但在 ID 或类上使用 jQuery 不会返回任何内容,这意味着他们没有在他们的网站上使用 jQuery。
如何为不使用 jQuery 的网站(例如 CNN 或 Instapaper.com)构建我的爬虫?
我已经尝试过$$
,但我似乎无法找到方法来调用它来获取孩子或 div 的值之类的东西。
任何建议都会非常有帮助!
我正在使用刮刀,我想刮掉某些网站,但在 ID 或类上使用 jQuery 不会返回任何内容,这意味着他们没有在他们的网站上使用 jQuery。
如何为不使用 jQuery 的网站(例如 CNN 或 Instapaper.com)构建我的爬虫?
我已经尝试过$$
,但我似乎无法找到方法来调用它来获取孩子或 div 的值之类的东西。
任何建议都会非常有帮助!
看看jQueryfy。它似乎完全符合您的需要。但是使用本机 javascript 可能是一个更好的主意。
自己注入 jQuery。
var script = document.createElement("script");
script.type = "text/javascript";
script.src = "//ajax.googleapis.com/ajax/libs/jquery/1.9.1/jquery.min.js";
var body = document.getElementsByTagName("body")[0];
body.appendChild(script);
注意:这也非常适合作为浏览器书签 - 在调试不使用 jQuery 的应用程序时,这会产生奇迹。