所以这可能是一个令人费解的问题,但这里有:
我正在使用 node.js 创建一个简单的、本地托管的网络爬虫。当我手动定义要在源文件中抓取的 URL 时,它工作得非常好,我现在正试图提示用户输入他们选择的 URL。然后我将他们输入的 URL 附加到一个空的 div 中,理想情况下,我可以使用cheerio 来获取该 div 的内容。
不幸的是,我不知道如何解析正在运行脚本的同一页面上创建的数据。任何见解都会非常非常感谢!
var cheerio = require("cheerio");
response.write('<div id="newsStory"></div>');
response.write("<script type='text/javascript'>var userPrompt = prompt('input a url');");
response.write("if(userPrompt) {document.getElementById('newsStory').innerHTML = userPrompt;}");
response.write("</script>");
var $ = cheerio.load();
var url = $('div#newsStory').text(); //does not work!
var url = "http://www.cnn.com/2013/09/23/us/south-carolina-powerball-winner/"; //manually inputting a url works!