我已使用 Sikuli 将页面的源代码保存到文件中。我需要对一批矩阵样式放置的元素进行“综述”。但我不想计算它们之间的尺寸。我希望在地址栏中输入 URL。所以我在 MZDN JavaScript 的帮助下从头开始编写了这样一个“简单”的操作。我不想使用 lxml。我想要真正的原生库——我的意思是我需要“便携式”脚本。所以我用谷歌搜索了一段时间,并决定在 Stack OverFlow 上提问。我不想用
split('<a href=')
魔法。我想在 Python 中做到这一点(以最 Pythonic 的方式):
var array = document.getElementsByClassName('another')
var j = array.length
for (i=0;i<j;i++) {
element = array[i];
url = element.getElementsByTagName('a')[0].href;
console.log(url);
}
var array = document.getElementsByClassName('else')
var j = array.length
for (i=0;i<j;i++) {
element = array[i];
url = element.getElementsByTagName('a')[0].href;
console.log(url);
}
设法做到这一点split
。Python是为孩子们准备的。
def read_file(filename):
fd = open(filename, 'r')
data = fd.read()
fd.close()
return data
def href(line):
url = line.split('a href=')[1].split('>')[0].strip().replace('"', '').replace("'", '')
return url
html = read_file('source.htm').split('\n')
for line in html:
if 'one' in line:
print href(line)
elif 'another' in line:
print href(line)
elif 'else' in line:
print href(line)