问题标签 [openrefine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3744 浏览

openrefine - 如何在 Google Refine 中分面多个列

我有一个包含 30 列和多行的数据集(某些单元格没有数据)。我希望能够对组中的列进行分面。

鉴于上述数据,我希望方面重新调整一组列中的实例数。对于前三列,我需要返回方面:

我在加载数据时尝试合并列,但单个数据也被分组。这不是预期的结果。例如:

提前致谢。

0 投票
1 回答
1000 浏览

json - Google Refine:遍历 JSON 字典

我在 Google Refine 中有一些 JSON - http://mapit.mysociety.org/point/4326/0.1293497,51.5464828完整版,但缩写如下:

我只想提取具有(假定唯一)类型的对象的名称WMC

在 Google Refine 中解析 JSON没有帮助,它适用于数组,而不是字典。

有什么建议我应该考虑解决这个问题吗?


编辑:我不知道初始键是什么:我相信它们是我无法提前预测的唯一标识符。

0 投票
1 回答
229 浏览

freebase - 来自 Freebase 的 Google-Refine/add 列:约束似乎不起作用

我有一列与 Freebase 调和的城镇。现在我想从 Freebase 创建一个包含人口的新列。我在约束中添加了“人口»数字”列

{"year>":"2006", "year<":"2012", "sort":"-year", "limit":1 }

为了获得最新的号码(见http://code.google.com/p/google-refine/issues/detail?id=92#c5)。取而代之的是,我得到了 10 个数字,就好像没有考虑约束一样。有人可以帮忙吗?

谢谢

0 投票
1 回答
907 浏览

data-cleaning - 谷歌优化行和列之间的交叉引用

我不确定这是否可以在 Google Refine 中实现。但基本上,我有这样的数据。

在此处输入图像描述

在此处输入图像描述

第一个表是所有用户的表。第二张表显示所有朋友。但是,在"friends"列中的第二个表中,并非所有 id 都存在于我要删除的第一个表中。那么,如何friends在第二个表的列中搜索每个 id 并删除表 1 中不存在的 id?

0 投票
2 回答
686 浏览

openrefine - 在 OpenRefine 正则表达式中使用组

我想知道是否可以在 Open Refine GREL 语法中使用的 ReGeX 中使用“组”。我的意思是,我想用相同的字符和点替换后面和前面的所有点,但后面是空格,然后是字符。

就像是:

0 投票
5 回答
1611 浏览

clojure - 在 clojure 或 jython 中将日期转换为纪元时间

我正在寻找在 OpenRefine 中将日期转换为纪元时间的公式。我知道 GREL 语言不支持这一点,但我想知道 clojure 或 jython 是否支持,如果支持如何?

我根本不熟悉这些语言。

现在我正在使用 API 调用这个服务,但这是一个包含大量数据集的漫长过程。

谢谢

0 投票
1 回答
906 浏览

json - OpenRefine 中的单元格到列

我有一个要转换为 JSON 的 CSV 数据集。在转换之前,我需要重新格式化数据以获得正确的多维结构。数据包含瑞典上次选举的结果,并按县(“Kommun”)划分。有291个县,9个党。我想:

  • 每县一排,
  • 每一方一列,每一行显示每一方的结果。

这将产生 10 列(县 + 政党)和 291 行(每个县 1 个)。

如何使用 Open Refine/Google Refine 实现这一目标?我当前的数据如下图所示。

打开优化打印屏幕

0 投票
2 回答
1010 浏览

jython - OpenRefine 使用 jython 从列表中删除重复项

我有一列包含重复的值,例如

我正在使用删除重复项的 jython 应用转换(错误设置为保持原始),这是代码:

哪个在预览中有效,但未应用于该列。我究竟做错了什么?

0 投票
3 回答
5463 浏览

openrefine - Google Refine:在相似但不同的列上合并两个数据集?

我有两个数据集,它们的共同列名略有不同。

数据集 A:

数据集 B:

我认为 Google Refine / Open Refine 旨在以模糊的方式帮助协调这种混乱的数据,但似乎并非如此

有什么工具可以让我以模糊的方式匹配这些,而无需编写代码?如果需要,我可以很容易地编写代码,但令我惊讶的是,Google Refine 似乎并没有像我想象的那样做。

0 投票
1 回答
129 浏览

csv - 在 Google Refine 的列中添加每隔一对单元格

我有一个数据集,其中包含世界上每个国家/地区的男性和女性人数。

我想添加每对国家行的合并,并删除性别列,这样我最终会得到:

如何在 Google/Open Refine 中以这种方式添加行?