我得到一个这样的列表(数字是评论的数量)......
14 http://www.spiegelfechter.com/wordpress/8726/auswege-aus-der-sackgasse
26 http://www.spiegelfechter.com/wordpress/8722/die-asozialen-hinter-die-asozialen
77 http://www.spiegelfechter.com/wordpress/8717/in-gesetz-gegossene-verfassungswidrigkeit
91 http://www.spiegelfechter.com/wordpress/8714/the-same-procedure-as-every-year-europa-lugt-sich-selbst-in-die-tasche
279 http://www.spiegelfechter.com/wordpress/8709/konstruktionsfehler-des-grundeinkommens
...通过...
import urllib2
import re
def main():
pattern = re.compile('<a href="(.*)#comments".*>(\d+) Kommentare</a>')
liste = []
for k in range(2, 3):
for line in urllib2.urlopen("http://www.spiegelfechter.com/wordpress/page/" + str(k)):
matcher = pattern.search(line)
if matcher != None:
liste.append("%4s" % matcher.group(2) + " " + matcher.group(1))
for elt in sorted(liste):
print elt
if __name__ == '__main__':
main()
我有 77,但是如何在 python 中获得 4 ......?我认为 4 是在 javascript 中生成的,我认为它很难在 python 中处理 javascript,但在这种情况下它可能很容易?!