你能看看https://data.cityofnewyork.us/City-Government/ERROR-in-record-type/dq2e-3a6q
这显示了一个似乎不正确的记录类型。
表明
P:10,item":"Bloomfield"},{"count":9,item":"New Britain"},{"count":8,item":"West Htfd"},{"count":7,item":"Torrington"},{"count":6,item":"Meriden"},{"count":5,item":"Whfd"},{"count":4,item":"Manchester
如果您选择 count(*) 并按 record_type 分组,您会看到:
curl 'https://data.cityofnewyork.us/resource/636b-3b5g.json?$select=count(*),record_type&$group=record_type'
[ {
"count" : "1",
"record_type" : "P:10,item\":\"Bloomfield\"},{\"count\":9,item\":\"New Britain\"},{\"count\":8,item\":\"West Htfd\"},{\"count\":7,item\":\"Torrington\"},{\"count\":6,item\":\"Meriden\"},{\"count\":5,item\":\"Whfd\"},{\"count\":4,item\":\"Manchester"
}
, {
"count" : "36631085",
"record_type" : "P"
}
这意味着有 36M 记录类型的值为“P”,还有一个非常奇数。
对纽约市开放数据法的一项建议:
我们必须修改开放数据法 ( http://www1.nyc.gov/site/doitt/initiatives/open-data-law.page ) 要求纽约市政府机构不仅要开放数据,而且要实际使用政府机构公共网站的开放数据门户。
如果我们允许机构简单地将数据转储到门户中,那么我们就没有质量测试。机构可以吹嘘有多少数据集是开放的,但实际上没有人在使用这些数据。
这个简单的改变“机构必须使用它自己的数据(又名,dogfood)”将提高质量。如果您阅读,http: //www1.nyc.gov/site/doitt/initiatives/open-data-law.page 它只提到了一次质量,而没有提到数据的使用。门户不是吹嘘的东西,它是连接技术和政府的重要途径。
谢谢!