我正在尝试获取互联网页面的随机样本,我不想出于各种原因放弃谷歌搜索结果。这是我尝试过的方法;
import socket
from random import randint
def doesitserveawebpage(ip):
ip=str(ip)
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
try:
s.connect((ip, 80))
s.shutdown(2)
return True
except:
return False
def givemerandomwebsite():
adrformat = "%d.%d.%d.%d"
while True:
adr = adrformat % tuple(randint(0,255) for _ in range(4))
try:
print "Tring %s" % adr
name = socket.gethostbyaddr(adr)
if (doesitserveawebpage(adr)):
return name
else:
continue
except socket.herror:
continue
好吧,它不起作用。首先,它工作得太慢了。其次,它给了我不提供网页的地址。无论如何我可以使这段代码更好,还是你会建议另一种方法来解决这个问题?