我最近下载了最新版本的 nutch。(nutch-1.1) 在浏览它的代码时,我注意到有一个 conf/schema.xml 文件定义了与 nutch 捆绑的 solr 部分的模式。
这个 schema.xml 包含每个插件的字段。我的问题是,我如何找出特定插件正在重新调整的值?换句话说,如果我使用带有 nutch 的第三方插件(比如插件 X)并想在 schema.xml 中添加几个字段,我如何确定“插件 X”返回的内容以及它是否是字符串、整数、数组?
我的第二个问题是,我看到了 nutch 的 solrIndexer 使用的 conf/solrindex-mapping.xml。这让我更加困惑,因为并非 schema.xml 中的所有字段都在 solrindex-mapping.xml
为了简单地解释答案,假设 Plugin X 是与 nutch 捆绑的 feed 插件。