我正在尝试基于http://sujitpal.blogspot.com/2009/07/nutch-custom-plugin-to-parse-and-add.html为 Nutch 编写一个插件,以获取自定义标题查找器。
这很好用,并且在新字段中存储提取的标题是没有问题的。但我想在 Solr 中使用它而不是默认标题。问题是 Solr 需要多值字段,因为我有 2 个标题字段。
metadata.remove("标题");
没用。
我真的很想使用新标题而不是 Nutch 创建的默认标题。有什么建议么?