3

我想在我的 CKAN 实例中导入一组特殊的数据集。使用 CKAN-Harvester(http://docs.ckan.org/en/latest/harvesting.html),我可以从其他 CKAN 实例中收获。但我不需要所有的数据集。

是否可以仅收集带有 id 的特定数据集?

4

2 回答 2

1

不是不写一些代码。

您可以向收割机添加过滤器。collect_stage() [1] 是它向 CKAN 询问最新编辑的包(数据集)并为每个包创建一个作业的地方。然后为每个作业运行 fetch_stage() [2] 以下载每个作业,然后导入它们。您可以在 fetch_stage 中使用过滤器,或者更改gather_stage 以请求包的子集。

[1] https://github.com/okfn/ckanext-harvest/blob/2.0-dataset-sources/ckanext/harvest/harvesters/ckanharvester.py#L136

[2] https://github.com/okfn/ckanext-harvest/blob/2.0-dataset-sources/ckanext/harvest/harvesters/ckanharvester.py#L199

于 2013-05-03T20:05:18.270 回答
0

截至今天,2016 年 6 月 6 日,这还不是内置的,但是有一个未解决的问题 -允许过滤要收集的远程数据集 #155 - 请求您想要的完全相同的东西。

附带说明一下,包含/排除组织 #169 的 CKAN Harvester 选项已在 2015 年 10 月 27日合并,但正如其标题所述,它仅添加了organizations_filter_includeorganizations_filter_exclude.

于 2016-06-06T18:42:17.413 回答