问题标签 [openrefine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
85 浏览

freebase - 从 MQL 查询到业务/赞助接收者/赞助的空值

我正在运行一个关于滑板手 Steve Caballero 的简单查询

https://www.freebase.com/m/0qmzf

具有https://www.freebase.com/business/spired_recipient/sponsorship?schema=类型的属性

在 freebase 中,我可以看到该属性具有以下项目:

史蒂夫卡巴列罗的赞助商

MQL 是这样的:

但它返回这个:

谁能帮我弄清楚为什么列表的空值?谢谢

0 投票
1 回答
53 浏览

rdf - 在另一列中填充列的属性值

Column1 -> foaf:name -> Column 2

假设我想在第 2 列中显示第 1 列 URI 所指向的人的姓名。有没有办法通过 openrefine 和 rdf 扩展来实现这一点?

0 投票
1 回答
275 浏览

openrefine - 在没有标题的 csv 上使用 google-refine,并且每条记录有不同数量的列

我正在尝试以开放优化方式导入从 NoSQL 数据库(Cassandra)中提取的 csv,没有标题并且每条记录的列数不同。

例如,字段以逗号分隔,如下所示:

有最大数量的列,并且不需要对其名称进行清理。

如何制作可以使用数据透视表挖掘的大型 Excel 文件?

0 投票
1 回答
357 浏览

openrefine - 枚举谷歌细化/ openrefine中的范围的值

我有一个带有一系列标识符的 OpenRefine 列。有些是单个整数(22, 27),有些代表一个范围(28-33, 10023-10110)。我正在寻找一种方法来明确该范围内的每个数字,这样我就可以将每个值设为自己的行。

0 投票
1 回答
97 浏览

regex - Google Refine:我可以在正则表达式中使用变量吗?

我正在尝试在 Open/Google Refine 中做这样的事情:

那就是循环一个关键字数组来检查单元格是否包含它们中的任何一个。如何使用这些关键字构建正则表达式?

有任何想法吗?

0 投票
2 回答
4600 浏览

openrefine - 如果所有列都相同,则在 Google Refine (OpenRefine) 中合并行的最简单方法

我正在使用 OpenRefine(以前是 Google Refine)从多个来源清理数据。我有来自不同来源的包含公司的文件,列定义是相同的,即

我想要的是这个结果(只有最后一个公司被合并,所有列都是相同的)

有没有一种简单的方法可以做到这一点?

我知道我可以将所有列连接成一个新列,但这是一个小 PITA,因为列数。

也许新列定义有一种方法可以遍历所有其他列并合并它?

0 投票
3 回答
1679 浏览

openrefine - 谷歌使用多个分隔符将字符串拆分为多列

我是 OpenRefine 的新手。

我想将下面两个示例的字符串拆分为不同的列。

示例 1:/articles/the_year_of_cooking_6_ways_to_make_2014_meals_your_best?affref=whatever

示例 2:/?Article=younger_looking_everything_5_tips_for_aging_well&affref=anotherwhatever

第一个例子应该分为三列:

/articles/ 烹饪之年 2014 年美食的 6 种方法?affref=随便

第二个例子应该分为三列:

/?Article= 看起来更年轻的 5 个老化技巧中的一切 &affref=anotherwhatever

编辑列>拆分似乎不允许使用不同的分隔符(“/”、“=”、“&”)

Edit Column > Add Column Based on This Column 似乎是正确的,但我对正则表达式或 GREL 的了解不够,无法实现。

任何帮助将不胜感激。

谢谢。

0 投票
2 回答
1712 浏览

openrefine - 打开 Refine / Google Refine - 删除列中的空白单元格

这个任务很容易理解,我有一个这样的表:

表格1

我想编辑“L1_latitud”列以折叠(或删除)所有空白单元格:

表2

这看起来像一个简单的任务,但我找不到处理它的方法。

0 投票
2 回答
4909 浏览

replace - 在 Google Refine 中搜索和替换多个值

我想在 Google Refine 中使用 GREL(或其他任何东西)的单个函数搜索和替换列中的多个值。

例如:
1. replace(value, "Buch", "bibo:Book")
2. replace(value, "Zeitschrift", "bibo:Journal")
3. replace(value, "Patent", "bibo:Patent" )
4. 还有更多。

有没有办法用一个 GREL 表达式来做到这一点?

0 投票
2 回答
344 浏览

openrefine - OpenRefine - 跨列聚类

看起来,OpenRefine 还不支持跨列聚类。

有没有人对如何根据“制造商”对“模型”进行聚类有任何建议,就像“城市”将基于“州”一样(许多“斯普林菲尔德”可能存在于美国,但只有“城市”聚类: “斯普林菲尔德”,如果相对“状态”列相同)?相对列已经标准化。