基本要求:
- 应该能够索引 MediaWiki、Confluence、Sharepoint、GitHub:Enterprise、Askbot 等内容
- 应该对重复数据删除结果相当聪明(Confluence 搜索如此痛苦的原因之一)。
- 绝对应该包含启发式方法,例如链接到文档的页面数量,搜索词是否在文档标题中等。如果用户有办法降低特定结果的排名,那可能是一个奖励。
- 应该有些可调(例如,更喜欢 Confluence 而不是 Sharepoint,将某些路径列入黑名单)。
是否有现成的产品可以做到以上几点?自由和开源项目?是否有 FOSS 项目可以提供上述基础知识并且易于扩展或构建前端?