1

我读到 OpenRefine Wikidata 插件总是以行模式运行

我在记录模式下有数据的情况:记录是连续/杂志,该记录中的行是同一连续/杂志的各种格式(通常是纸质版和电子版)。每行都有一个唯一的 ISSN 标识符。Wikidata 认为序列/杂志只有一个项目(我的记录),但每种格式都没有单独的项目(我的行)。

在将数据与 Wikidata 核对时,同一记录的所有行通常会匹配相同的 wikidata 项目,或者没有任何行匹配,或者某些记录只有一行匹配(例如,如果只有一个格式的 ISSN - 比如说纸格式 - 在 Wikidata 中已知,但在其他数据中未知)。

在此处输入图像描述

我想做的是在 Wikidata 中为未找到协调结果的每条记录创建项目(iow,没有匹配的行),而不是为每一。而且,在创建此项目时,我想添加此记录中所有行的 ISSN。

我想知道是否可以这样做?如何 ?

谢谢

4

1 回答 1

0

对的,这是可能的。您需要改为对第一列执行对帐操作。

  • 如文档所述,在定义您的记录的第一列上使用Fill down操作;
  • 将列与 Wikidata 核对;
  • 然后,为相似的单元格创建一个新项目操作(在协调->操作菜单中)
  • 创建一个架构,其中第一列用作主题 ID。

假设您的第一列中的值最初是不同的(在您的示例中就是这种情况),这将为每条记录创建一个项目。

在您的示例中,因为您的第一列包含 ISSN 而不是标题,所以我将首先创建一个带有标题的根列(在上述过程之前)。在行模式下,通过在第一列中选​​择非空白值来保留每条记录的第一行,然后复制带有标题的列,并将这个新列移动到第一个位置。这应确保对帐能够提取现有项目。请注意,如果多个期刊使用相同的标题,这将为它们创建一个项目,除非您在对帐配置中添加其他属性(例如 ISSN)。

于 2019-10-10T14:54:22.707 回答