我有一个包含 URL 列表的输入文件。我正在尝试在每个 URL 上执行一个脚本,并将该脚本的结果输出到 CSV。
一个示例是尝试查找给定的网站列表是否正在使用 Google Analytics。下面的脚本在页面上下文中运行时将返回类似“{'GA': true}”的 JSON。
var scripts = document.getElementsByTagName("script");
var source = [];
for (var i = 0; i < scripts.length; i ++) {
var s = scripts[i];
if (!s.src) continue;
source.push(s.src);
}
checkforGA();
function checkforGA() {
var tools = {};
for (var j = 0 ; j < source.length; j ++) {
if (/google-analytics.com\/(ga|urchin).js/i.test(source))
{
tools.GA = true;
return JSON.stringify(tools);
}
else
{
tools.GA = false;
return JSON.stringify(tools);
}
}
}
我的输入是一个包含站点列表的 csv 文件
Google, http://google.com
Wikipedia, http://wikipedia.com
Techcrunch, http://techcrunch.com
Stackoverflow, http://stackoverflow.com
Yahoo, http://yahoo.com
我想要的输出是
Google, http://google.com, {'GA': false}
Wikipedia, http://wikipedia.com, {'GA': false}
Techcrunch, http://techcrunch.com, {'GA': true}
Stackoverflow, http://stackoverflow.com, {'GA': true}
Yahoo, http://yahoo.com, {'GA': false}
我不确定是否可以从 python 脚本中运行 js,但我正在寻找一些关于如何开始的想法。