问题标签 [openrefine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
openrefine - 如何在 Google Refine 中分面多个列
我有一个包含 30 列和多行的数据集(某些单元格没有数据)。我希望能够对组中的列进行分面。
鉴于上述数据,我希望方面重新调整一组列中的实例数。对于前三列,我需要返回方面:
我在加载数据时尝试合并列,但单个数据也被分组。这不是预期的结果。例如:
提前致谢。
json - Google Refine:遍历 JSON 字典
我在 Google Refine 中有一些 JSON - http://mapit.mysociety.org/point/4326/0.1293497,51.5464828完整版,但缩写如下:
我只想提取具有(假定唯一)类型的对象的名称WMC
。
在 Google Refine 中解析 JSON没有帮助,它适用于数组,而不是字典。
有什么建议我应该考虑解决这个问题吗?
编辑:我不知道初始键是什么:我相信它们是我无法提前预测的唯一标识符。
freebase - 来自 Freebase 的 Google-Refine/add 列:约束似乎不起作用
我有一列与 Freebase 调和的城镇。现在我想从 Freebase 创建一个包含人口的新列。我在约束中添加了“人口»数字”列
{"year>":"2006", "year<":"2012", "sort":"-year", "limit":1 }
为了获得最新的号码(见http://code.google.com/p/google-refine/issues/detail?id=92#c5)。取而代之的是,我得到了 10 个数字,就好像没有考虑约束一样。有人可以帮忙吗?
谢谢
data-cleaning - 谷歌优化行和列之间的交叉引用
我不确定这是否可以在 Google Refine 中实现。但基本上,我有这样的数据。
第一个表是所有用户的表。第二张表显示所有朋友。但是,在"friends"
列中的第二个表中,并非所有 id 都存在于我要删除的第一个表中。那么,如何friends
在第二个表的列中搜索每个 id 并删除表 1 中不存在的 id?
openrefine - 在 OpenRefine 正则表达式中使用组
我想知道是否可以在 Open Refine GREL 语法中使用的 ReGeX 中使用“组”。我的意思是,我想用相同的字符和点替换后面和前面的所有点,但后面是空格,然后是字符。
就像是:
clojure - 在 clojure 或 jython 中将日期转换为纪元时间
我正在寻找在 OpenRefine 中将日期转换为纪元时间的公式。我知道 GREL 语言不支持这一点,但我想知道 clojure 或 jython 是否支持,如果支持如何?
我根本不熟悉这些语言。
现在我正在使用 API 调用这个服务,但这是一个包含大量数据集的漫长过程。
谢谢
json - OpenRefine 中的单元格到列
我有一个要转换为 JSON 的 CSV 数据集。在转换之前,我需要重新格式化数据以获得正确的多维结构。数据包含瑞典上次选举的结果,并按县(“Kommun”)划分。有291个县,9个党。我想:
- 每县一排,
- 每一方一列,每一行显示每一方的结果。
这将产生 10 列(县 + 政党)和 291 行(每个县 1 个)。
如何使用 Open Refine/Google Refine 实现这一目标?我当前的数据如下图所示。
jython - OpenRefine 使用 jython 从列表中删除重复项
我有一列包含重复的值,例如
我正在使用删除重复项的 jython 应用转换(错误设置为保持原始),这是代码:
哪个在预览中有效,但未应用于该列。我究竟做错了什么?
openrefine - Google Refine:在相似但不同的列上合并两个数据集?
我有两个数据集,它们的共同列名略有不同。
数据集 A:
数据集 B:
我认为 Google Refine / Open Refine 旨在以模糊的方式帮助协调这种混乱的数据,但似乎并非如此。
有什么工具可以让我以模糊的方式匹配这些,而无需编写代码?如果需要,我可以很容易地编写代码,但令我惊讶的是,Google Refine 似乎并没有像我想象的那样做。
csv - 在 Google Refine 的列中添加每隔一对单元格
我有一个数据集,其中包含世界上每个国家/地区的男性和女性人数。
我想添加每对国家行的合并,并删除性别列,这样我最终会得到:
如何在 Google/Open Refine 中以这种方式添加行?