问题标签 [openrefine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
528 浏览

openrefine - OpenRefine - 添加序列号,为每条记录重置

我有一些包含多行的记录。我想根据第一行中的字符串为记录中的每一行提供一个唯一 ID,其中包含原始 ID + _01 _02 _03 等等。

然后我希望计数器在下一个带有新字符串的记录开始时重置,并重复上述操作。

0 投票
2 回答
120 浏览

freebase - OpenRefine reconciliation service not working - mutliple vs single queries

I have been using OpenRefine 2.6 Beta 1 w/o problems since its release, and later, with the reconciliation service at:

http://reconcile.freebaseapps.com/reconcile

However, in the past fee days, I have not been able to use it all. If I go to the URL:

http://reconcile.freebaseapps.com/

and type the multiple query:

I obtain:

But if I try a simple query:

I get:

Any insights into what's happening with the reconciliation service? Is there any other service I could use to replace freebaseapps.com?

Thanks

0 投票
1 回答
61 浏览

openrefine - 卡在 Open Refine 2.6 中的 freebaseapps 协调

我有一些包含 10 个演员名字的小测试数据,我想用一些额外的数据来扩展它们。

屏幕截图 2016-01-16 at 3 06 23 pm

使用此对帐服务可以正常工作:http ://reconcile.freebaseapps.com/reconcile 。但是,现在它被困在那里。服务有问题吗?

屏幕截图 2016-01-16 at 3 07 36 pm

屏幕截图 2016-01-16 at 3 04 55 pm

0 投票
1 回答
238 浏览

python - 在 python 中为 Openrefine 创建 json

我在 python 中抓取资源,我想制作一个 json 文件,在 Openrefine 中使用它来清理数据。

这是我的代码:

没关系,直到我将文件上传到 Openrefine 中:我无法单击正确的节点,而只能单击特定元素。这是一个例子:

我只能点击特定元素

我认为使用 python 生成 json 时出错,我尝试放置两个 {{}} 但它给了我一个“dict”错误,所以我尝试将元素放入数组但没有任何效果。

作为请求,这里是 json 的一部分:

在此处输入图像描述

ps 我正在使用编解码器,因为有非拉丁字符

0 投票
1 回答
117 浏览

openrefine - 丢失了我在 Openrefine 上的所有文件

我尝试了 Openrefine 的测试版,现在我在 2.5 版上丢失了所有以前的文件。你知道文件在哪里吗?我在 Mac 上。

谢谢!

0 投票
1 回答
1775 浏览

regex - openrefine 使用正则表达式从文本列中提取数字

我正在尝试从通过 Kaggle 找到的 OpenFoodFacts 数据集中解析出一列数据。有一个名为“serving_size”的属性,它包含包装上显示的食品的任何份量信息。大多数情况下,份量以克 (g) 表示,但通常也有其他文本。我希望能够搜索字符串,找到与克数对应的数字,并将该值提取到自己的字段中。该值不仅仅是一个整数 - 它可能有一个小数。

我是正则表达式的新手,但似乎应该可以搜索“g”字符,并且如果它是由任何数值进行的以提取它们。我发现一些食谱表明这是可能的,但到目前为止,我尝试过的任何方法都没有奏效。在 OpenRefine 文档中,他们给出了使用此正则表达式提取十进制数据的示例:/[-+]?[0-9]+(.[0-9]+)?/,但我无法得到任何变化在我们的场景中工作。我也试过像“value.match(/(.)?(/ d+[g]). ?/)”这样的命令。我发现我不明白正则表达式应该如何工作 - 当我告诉它“/d”时,我希望它只会给我返回数值,

任何帮助,将不胜感激。

以下是数据中的一些示例文本字符串:

尝试截图

0 投票
3 回答
537 浏览

regex - OpenRefine 自定义文本分面

我有一列名称,例如:

  • 夸利亚,彼得罗·保罗
  • 伯纳德,克莱尔沃,圣,或
  • .E.,卡尔文 F.
  • Swingle, M Abate, 阿戈斯蒂诺, Assereto
  • 阿巴蒂,安东尼奥
  • 10-NA)\u, Ferraro, Giuseppe, ed, Biblioteca comunale ariostea。女士。(埃斯特里

我想用 openrefine 制作一个自定义文本方面,用一个逗号将名称标记为“真”,而其他所有名称都标记为“假”,这样我就可以使用最后一个(“.E.,Calvin F.”不是问题,我稍后会处理)。

我正在尝试使用“自定义文本方面”和这个表达式:

但结果全是假的。什么是错误的部分?

0 投票
0 回答
174 浏览

openrefine - 打开优化:打开项目问题

我是 Open Refine 用户。我将此工具与 RDF 扩展一起使用。我创建了许多 RDF 项目。每次打开此工具时,我都会在 Open Refine 的“打开项目”选项下找到我现有的项目。两天前,我用最新版本更新了计算机的 Java。现在,当我单击“打开项目”选项时,它显示为空。它说没有现有的项目。“RDF 扩展”也不可用。如何找到我以前的 RDF 项目?请告诉我。我有一些重要的项目,我真的需要这些。任何帮助将不胜感激。

0 投票
1 回答
205 浏览

ontology - RDFRefine - 无法访问导入的本体?

我正在使用 OpenRefine 及其扩展 RDFRefine。我正在尝试导入一个本体,其 URI 位于http://purl.org/vocab/participation/schema#并建议前缀:参与。当我添加前缀并插入 URI 时,它没有问题。但是,当我尝试访问它的属性时,它会说:“不在导入的词汇定义中。” 但我仍然可以在可用前缀中看到它(参与)。

知道为什么会这样吗?导入 W3 Basic Geo 词汇表时没有遇到这个问题(https://www.w3.org/2003/01/geo/)。

0 投票
1 回答
332 浏览

openrefine - Openrefine 列中的渐进数字

是否可以使用 GREL 生成“计数器”,即列中的累进数字?

例如,我想添加value到该数字以生成每条记录的标识符。