我编写了这个小脚本来从CitiBike 网站提取 JSON 提要。
这是脚本:
import requests
import time
def executeCiti():
r = requests.get("http://citibikenyc.com/stations/json")
print r.json()
time.sleep(62)
while True:
executeCiti()
exit()
然后我只是在终端中运行脚本并将其输出到一个 .txt 文件,如下所示: python citi_bike.py > output.txt
在本练习结束时,我想要的最终目标是格式良好的 JSON 数据(每个请求中只选择少数几对),由每个请求分隔。我希望它易于管理,以便我可以从中创建可视化。
我的第一个问题是:这是开始我想要完成的事情的好方法吗?
我的第二个问题是:有没有更好的方法开始,让数据像我想要的那样作为我的最终目标出现?关于这个问题,我觉得我已经开始采取一种非常迂回的方式来获得一个清理过的数据集,尽管这只是第一步。
对不起,如果这令人困惑。如果您有任何问题,请发表评论。