我需要使用 FINDALL 来抓取所有特定的网页并将它们传递到一个数组中,但是只有不带引号的链接这是我到目前为止所拥有的,如果不是一个数组,我可以将一个变量传递给我可以使用的循环中的每个单独的链接他们一个接一个或一次全部
#!/usr/bin/env python
import re,urllib,urllib2
Url = "http://www.ihiphopmusic.com/music"
print Url
print 'test .............'
req = urllib2.Request(Url)
print "1"
response = urllib2.urlopen(req)
print "2"
#reads the webpage
the_webpage = response.read()
#grabs the title
the_list = re.findall(r'number-link" href="(.*?)#comments">0</a>',the_webpage)
print "3"
the_list = the_list.split(',')
arrlist = array('c',the_list)
print arrlist
结果
http://www.ihiphopmusic.com/music
test .............
1
2
3
Traceback (most recent call last):
File "grub.py", line 17, in <module>
the_list = the_list.split(',')
AttributeError: 'list' object has no attribute 'split'