我想在我的 CKAN 实例中导入一组特殊的数据集。使用 CKAN-Harvester(http://docs.ckan.org/en/latest/harvesting.html),我可以从其他 CKAN 实例中收获。但我不需要所有的数据集。
是否可以仅收集带有 id 的特定数据集?
我想在我的 CKAN 实例中导入一组特殊的数据集。使用 CKAN-Harvester(http://docs.ckan.org/en/latest/harvesting.html),我可以从其他 CKAN 实例中收获。但我不需要所有的数据集。
是否可以仅收集带有 id 的特定数据集?
不是不写一些代码。
您可以向收割机添加过滤器。collect_stage() [1] 是它向 CKAN 询问最新编辑的包(数据集)并为每个包创建一个作业的地方。然后为每个作业运行 fetch_stage() [2] 以下载每个作业,然后导入它们。您可以在 fetch_stage 中使用过滤器,或者更改gather_stage 以请求包的子集。
截至今天,2016 年 6 月 6 日,这还不是内置的,但是有一个未解决的问题 -允许过滤要收集的远程数据集 #155 - 请求您想要的完全相同的东西。
附带说明一下,包含/排除组织 #169 的 CKAN Harvester 选项已在 2015 年 10 月 27日合并,但正如其标题所述,它仅添加了organizations_filter_include
和organizations_filter_exclude
.