问题标签 [openrefine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1318 浏览

openrefine - OpenRefine 的对账服务不起作用?

有没有人在 OpenRefine 中遇到过和解问题?我已经导入了美国大学和学院的列表,选择了 50 行,并尝试了 Freebase、DBpedia、OpenCorporates 对帐服务。我以前在 DBpedia 上取得过多次成功(针对高校),但现在,这些都没有奏效。(我也浏览了列出的所有服务。)我已经修剪了前导和尾随空格,检查了重复项等。大约两个月前事情还运行良好,并且在那段时间我还没有更新 OpenRefine。[更新]:我能够使用一项协调服务,但不能使用我想要的本体。因此,要么我忘记了一些关键信息,要么协调大学/学院名称的服务不再起作用。

0 投票
2 回答
490 浏览

html - 在openrefine中提取一个包含字符串的html标签?

标题没有什么可补充的。这就是我想要做的。有什么建议么?

我查看了 github 上的文档并在 Google 上进行了广泛搜索。

我得到的最好的是:

它会导致语法错误。

0 投票
1 回答
71 浏览

regex - 如何将谷歌中的单个单元格从括号中的多个数字细化为逗号

我该如何改变

进入

在 Google Refine 中使用 GREL 和 Regex。

0 投票
1 回答
497 浏览

etl - Openrefine 使用模板将 JSON 导出为记录

最近几天我一直在使用 Openrefine,试图弄清楚如何将 Google 数据表导出到 JSON 文件中。

我有以下要导出到 JSON 文件的数据。

我期待的 JSON 是:

到目前为止,我已经尝试了几种方法:

1) 使用 excel-to-json,但仅限于单一嵌套,并且对列名有一些限制

2) 使用 Openrefine 和模板工具,但我遇到了几个问题: - 虽然它们在 openrefine 中被检测为记录,但您导出行而不是记录,因此它将 6 行导出到 JSON,其中 4 行包含空数据 - 如果我尝试填写列它也会将 6 行导出到 JSON,其中 4 行有重复项,从而失去该人与其家人和朋友之间的关系

任何帮助将不胜感激,因为我正在尝试导出大约 150,000 条这种类型的记录,这些记录必须采用这种 JSON 格式。

0 投票
1 回答
270 浏览

cluster-analysis - Openrefine:跨集群两个数据集

我有两个带有标题和其他信息的数据集,但在数据集中 AI 有标题,在数据集中 BI 有标题和 URL。
我必须将 URL 从数据集 B 放入数据集 A 中。有些标题在 A 和 B 中是相同的,有些则不是,有些则略有不同(问题来了)。

所以我需要同时合并和聚类那些相似的。我知道我可以与 DBpedia 协调,但我需要的是在两个数据集之间“协调”。以某种方式可能吗?

谢谢你。

0 投票
1 回答
732 浏览

data-manipulation - 在 OpenRefine 中将 x 列合并到 n 列

我有一个列数未知的表,我需要在某个点之后合并所有列。考虑以下:

AC 列是已知的,并且其中的信息是正确的。但是 D 到 N 列(以 D 开头的未知数量的列)需要合并,因为它们都是同一字符串的一部分。如何在 OpenRefine 中组合未知数量的列?

由于某些列可能有空单元格(字符串可能有各种长度),我还需要忽略空单元格。

0 投票
1 回答
182 浏览

data-manipulation - Google Refine - 在单元格中提取相同的值

我有一列看起来像这样的数据

它多次本质上是同一件事,但由于这些是由用户输入的,它们可能会有所不同。如果您注意到最后一个缺少 e。

我想做的是创建一个新列,其中只有唯一的名称。因此,新列将仅包含“Lymore Cottages, Lymor Cottages”。

我相信这可以通过 Google/open Refine 实现。我尝试了聚类,但这也将所有其他行聚类到具有相同细节而不是每个单元格。(无论是否有其他 20 行具有相同数据,我都需要对每一行进行此操作)

0 投票
1 回答
66 浏览

undefined - OpenRefine 未定义/语言错误

新的 OpenRefine 安装:我看到“Extensions: Undefined”,这与 Freebase 扩展不再工作有关,而且在创建项目时没有出现其他文本。

我在某处读到有一种解决方法,方法是在主屏幕的语言设置中将语言设置为英语(或意大利语)。但我找不到那个语言设置面板/选择。

它在哪里?

0 投票
1 回答
384 浏览

openrefine - 将列导入现有 OpenRefine 项目

如何将外部 .csv 文件中的列添加到现有项目?

我试图在网上找到解决方案,但没有成功。

0 投票
1 回答
673 浏览

openrefine - 批量替换所有列中的文本

我正在使用 OpenRefine 进行一些数据准备。我有几十列需要使用相同的 GREL 表达式进行清理value.replace("text to be replaced","new text")

如何一次将 GREL 表达式批量应用于所有列?