我们正在尝试将网页的内容与 url、状态和元数据信息一起存储在Status Index中。
我们尝试编辑ES_IndexInit.sh并在 Status 的映射部分添加下一个属性:
"content": {
"type": "text",
"index": "true",
"store": true
}
我们的猜测是,我们将不得不更改 Storm crawler 项目中的 Java 源代码,但不知道如何进行。
任何见解都会非常有帮助。先感谢您。