我正在使用带有远程收割扩展的 CKAN 2.9 版本。
我不想收集所有数据集,我想收集网站包中名称或 ID 的选定数据集。
我可以在配置中使用过滤器,例如使用 CQL 过滤器或其他方式的可能性(另一个分机?)?如果我必须使用配置,您是否知道如何使用过滤器收集数据集和一个简单的示例?
默认情况下,CKAN 收集器扩展允许您按组织或组数据集进行过滤,以包含或排除收集。例如,您可以通过添加 "organizations_filter_include": ['org_1'] 键来仅为 org_1 收集数据集。有关更多信息,请查看Github 中的收割机文档。如果这对您不起作用,您可以使用IHarvester 接口并添加您自己的逻辑,这可能比使用上述 Harvester 提供的逻辑更复杂。