我完全迷路了。我想我肯定在这里遗漏了一些基本的东西。每个人都对 Solr 有这么棒的评价,但我没看到。
我在 Solr 中索引了一个结构化的 pdf 文档。问题是当我搜索一个简单的字符串时 - 我将整个内容字段作为响应!我不知道如何改变它。我的要求是,假设我搜索它应该给我的“元数据”
" MetadataDiscussion . . . 4 个匹配项...确保 Tika 用户有机会获得 Tika 创建和/或提取的所有元数据。== 原始问题 == 此页面的原始灵感是 Tika .. . 10.7k - rev: 2 (current) last modified: 2010-08-02 18:09:45 "
但它给了我整个文档!- 被索引的整个字符串。似乎 Lucene 只能告诉我它发生在哪个领域,而不是它发生在哪个领域
任何帮助将不胜感激!!