0

我已使用 Sikuli 将页面的源代码保存到文件中。我需要对一批矩阵样式放置的元素进行“综述”。但我不想计算它们之间的尺寸。我希望在地址栏中输入 URL。所以我在 MZDN JavaScript 的帮助下从头开始编写了这样一个“简单”的操作。我不想使用 lxml。我想要真正的原生库——我的意思是我需要“便携式”脚本。所以我用谷歌搜索了一段时间,并决定在 Stack OverFlow 上提问。我不想用

split('<a href=')

魔法。我想在 Python 中做到这一点(以最 Pythonic 的方式):

var array = document.getElementsByClassName('another')

var j = array.length
for (i=0;i<j;i++) {
    element = array[i];
    url = element.getElementsByTagName('a')[0].href;
    console.log(url);
    }

var array = document.getElementsByClassName('else')
var j = array.length
for (i=0;i<j;i++) {
    element = array[i];
    url = element.getElementsByTagName('a')[0].href;
    console.log(url);
    }

设法做到这一点split。Python是为孩子们准备的。

def read_file(filename):
    fd = open(filename, 'r')
    data = fd.read()
    fd.close()
    return data

def href(line):
        url = line.split('a href=')[1].split('>')[0].strip().replace('"', '').replace("'", '')
        return url

html = read_file('source.htm').split('\n')
for line in html:
    if 'one' in line:
        print href(line)
    elif 'another' in line:
        print href(line)
    elif 'else' in line:
        print href(line)
4

0 回答 0