问题标签 [opendata]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
221 浏览

r - 使用 R 从 api 获取和解析 geojson 文件

我需要从 ESRI 开放数据 API 获取 GeoJSON 数据集,然后解析结果数据。有没有人使用 R 从 API 获取 geoJSON 数据并将其转换为数据框进行分析?

这是我要获取的数据的示例:

洛杉矶活跃企业列表:http: //geohub.lacity.org/datasets/5caa1112258942c68fc4cce33fc13874_0

API端点: http: //geohub.lacity.org/datasets/5caa1112258942c68fc4cce33fc13874_0.geojson

感谢!

0 投票
2 回答
369 浏览

sparql - 使用 SPARQL 从公开数据中下载 GeoJSON 边界

我有兴趣从statistics.gov.scot下载一些边界文件,这是一个官方统计存储库,用于共享利用 SPARQL 查询的统计数据。

背景

Statistics.gov.scot提供对许多行政和统计地理区域的 GeoJSON 边界的访问,例如地方当局行政边界卫生委员会。在我的特殊情况下,我有兴趣下载与数据区域有关的 GeoJSON 边界的数据集。数据区是为在小区域范围内传播生活结果数据而开发的统计地理。通过statistics.gov.scot示例数据区访问时,如下所示:

样本数据区

地理和相关数据可以在这里访问。相应的 GeoJSON 数据可在此处获得。

问题

数据区在两个迭代中可用,一个是在 2004 年生成的,另一个是最近更新的。我想下载2004 年制作的第一次迭代。根据有关统计实体的信息,我起草了以下查询:

它返回以下错误消息:

通过端点测试时: http: //statistics.gov.scot/sparql

注释

理想情况下,我想开发其他查询,使我能够通过使用entity:前缀来获取其他统计地理信息。这应该是可能的,因为entity:它将包含有关可用地理位置的信息(名称、首字母缩写词、创建日期)。


查询:

让我得到了一些看起来像所需地理位置列表的东西,但我正在努力寻找 GeoJSON 边界。

0 投票
1 回答
731 浏览

r - 以 100% 压缩率提取 Zip 文件

我在尝试运行以下 R 脚本时注意到了这个问题。

由于某种原因,脚本一直在旋转,所以我手动下载了数据,发现压缩率为 100%。

在此处输入图像描述

我不确定 StackOverflow 是否是这个问题的最佳交换,所以我愿意移动这个问题是否建议另一个交换。开放数据交换可能是合适的,但该站点上的活动并不多。

我的问题是:我经常使用来自医疗保险和医疗补助服务中心 (CMS) 的政府管理数据。从该站点下载的数据是 zip 文件的形式,有时它们的 zip 比率为 100%。这显然是不可能的,因为未压缩的大小约为 800PB。(CMS 在他们的网站上指出,他们估计未压缩的大小约为 4GB。)这对我的工作计算机产生了影响;我已经用同事的电脑和我自己的个人电脑复制了这个问题。

一个例子可以在这里找到。(单击链接,然后单击 NPPES 数据传播)。我注意到了其他一些例子,我已经通过电子邮件向 CMS 发送了有关此问题的电子邮件。他们回应说文件很大,无法用 Excel 处理。我知道这一点,这并不是我真正面临的问题。

有谁知道为什么会发生这种情况以及我该如何解决?

0 投票
0 回答
292 浏览

ruby-on-rails - 没有将字符串隐式转换为整数,打开日期过滤器

我实际上是在尝试使用来自开放数据巴黎的 Json,并过滤一些东西。

我可以用这些行创建我想要的:

这是我的 Json 的样子

我尝试按“类型创新”进行过滤。例如,我不想使用拥有“type_innovation”的数据创建帖子:“Lieux innovants de laculture et du sport”。

我试图像这样过滤:

当我尝试导入时,它会返回错误。我应该如何进行过滤?

0 投票
1 回答
747 浏览

sql-server - 如何更新现有 Azure SQL 数据库表作为数据源表(OData 链接/api)中的数据更改并在云中运行所有内容?

我正在做我的学校项目,我被困在某个地方,请提供一些帮助。我已将一个开放数据网站中的表导入我的 Azure SQL 数据库,但源中的数据每 30 分钟更改一次。我想在云中每 30 分钟自动更新一次最近的数据。

这可能Azure SQL database吗?

此时,我可以通过integration services手动运行包来完成。但我无法将它部署在 Azure sql 数据库中并自动执行。请提供帮助。先感谢您。

0 投票
1 回答
53 浏览

python - CKAN - choroplethmap

我已经正确安装了带有一些插件的 CKAN 2.5 版本,它正在生产服务器中运行。现在我想添加ckanext-mapviews 的扩展来配置常规的 choropleth 地图到 CKAN。

我已按照说明安装 setup.py 并将 choroplethmap 添加ckan.plugins属性的列表中,但我没有在视图类型列表中看到新的Choropleth Map图表类型选项。我也检查了日志,但不知道会发生什么。

有谁知道我能做些什么来解决这个问题?

0 投票
0 回答
27 浏览

socrata - 如何解释 Socrata New York City Real Property Legals 数据库中的记录类型?

你能看看https://data.cityofnewyork.us/City-Government/ERROR-in-record-type/dq2e-3a6q

这显示了一个似乎不正确的记录类型。

表明

如果您选择 count(*) 并按 record_type 分组,您会看到:

这意味着有 36M 记录类型的值为“P”,还有一个非常奇数。

对纽约市开放数据法的一项建议:

我们必须修改开放数据法 ( http://www1.nyc.gov/site/doitt/initiatives/open-data-law.page ) 要求纽约市政府机构不仅要开放数据,而且要实际使用政府机构公共网站的开放数据门户。

如果我们允许机构简单地将数据转储到门户中,那么我们就没有质量测试。机构可以吹嘘有多少数据集是开放的,但实际上没有人在使用这些数据。

这个简单的改变“机构必须使用它自己的数据(又名,dogfood)”将提高质量。如果您阅读,http: //www1.nyc.gov/site/doitt/initiatives/open-data-law.page 它只提到了一次质量,而没有提到数据的使用。门户不是吹嘘的东西,它是连接技术和政府的重要途径。

谢谢!

0 投票
1 回答
27 浏览

json - 你知道有关于公共交通服务的开放数据数据集的存储库吗?

我需要包含开放数据(无私有数据)的免费数据集或 Web 存储库,以便使用 Splunk Enterprise 构建可视化。

有什么建议么?

非常感谢,斯肯德

0 投票
0 回答
369 浏览

ckan - CKAN:收获受阻

我不确切知道问题出在哪里,所以我写在这里以获得一些提示或线索。我想知道是否有人对此有意见或想法。使用 ckan 进行收集似乎有效(我能够在开放数据站点上获取数据),但最后它的状态保持“正在进行”,因此它保持阻塞状态,我无法重新收集其他数据。谢谢

这是来自 fetch_consumer.log 的日志

在gather_consumer.log 的日志下方:

0 投票
1 回答
58 浏览

semantic-web - 如何使用特定的 Schema.org 实体查找数据集?

我正在尝试决定是否在我自己的开源应用程序中使用 schema.org 实体,以实现与现有开放数据集的潜在兼容性。所以我正在寻找“在野外”使用相关的 schema.org 实体。

现在我正在寻找膳食补充剂数据,即http://schema.org/DietarySupplementhttp://health-lifesci.schema.org/DietarySupplement

我一直在搜索语义网络搜索引擎,只找到了 Swoogle,但我没有得到该 URI 的结果,或者“服务暂时不可用”。

schema.org 上的 DietarySupplement 页面说“10 到 100 个”域正在使用这个实体。这是在谈论 DNS、Schema.org 上定义的抽象域、其他地方定义的抽象还是其他?