我在 Lucene 中存储的一些文档具有包含文件路径或 URI 的字段。如果他们的查询词包含路径或 URI 段,我希望用户能够检索这些文档。
例如,如果路径是
C:\home\user\research\whitepapers\analysis\detail.txt
我希望用户能够通过查询path:whitepapers
.
同样,如果 URI 是
http://www.stackoverflow.com/questions/ask
包含的查询uri:questions
将检索它。
我是否需要对这些字段使用特殊的分析器,或者 StandardAnaylzer 是否可以完成这项工作?我需要对这些字段进行任何预处理吗?(例如,用空格替换正斜杠或反斜杠?)
欢迎提出建议!