我正在编写一个脚本,它将根据以下内容从基本 HTML 页面中提取数据:
URL 中的第一个参数在 -90.0 和 90.0(含)之间浮动,第二组数字在 -180.0 和 180.0(含)之间。该 URL 会将您定向到一个页面,该页面以单个数字作为页面主体(例如,http://jawbone-virality.herokuapp.com/scanner/desert/-89.7/131.56/)。我需要在附加到 URL 的所有页面之间找到最大的病毒式传播数。
所以,现在我让它打印第一个和第二个数字,以及正文中的数字(我们称之为病毒式传播)。它只是打印到控制台,每次我尝试将它写入一个文件时它都会对我产生影响并且我得到错误。任何提示或我遗漏的任何东西?我对 Python 很陌生,所以我不确定我是否遗漏了一些东西。
import shutil
import os
import time
import datetime
import math
import urllib
from array import array
myFile = open('test.html','w')
m = 5
for x in range(-900,900,1):
for y in range(-1800,1800,1):
filehandle = urllib.urlopen('http://jawbone-virality.herokuapp.com/scanner/desert/'+str(x/10)+'/'+str(y/10)+'/')
print 'Planet Desert: (' + str(x/10) +','+ str(y/10) + '), Virality: ' + filehandle.readlines()[0] #lines
#myFile.write('Planet Desert: (' + str(x/10) +','+ str(y/10) + '), Virality: ' + filehandle.readlines()[0])
myFile.close()
filehandle.close()
谢谢!