我被要求部署或开发一个企业(内联网)搜索引擎,它可以索引几个内部服务器的所有网页,并有一个搜索门户来显示所有相关内容,就像谷歌正在做的事情,但对于内联网。
任何建议如何快速开发或部署?听说过微软FAST产品,不知道是不是这个用途?
提前谢谢,乔治
我被要求部署或开发一个企业(内联网)搜索引擎,它可以索引几个内部服务器的所有网页,并有一个搜索门户来显示所有相关内容,就像谷歌正在做的事情,但对于内联网。
任何建议如何快速开发或部署?听说过微软FAST产品,不知道是不是这个用途?
提前谢谢,乔治
根据您需要的抛光水平,Nutch 项目几乎是您的交钥匙解决方案。http://lucene.apache.org/nutch/
google Search Appliance是您可能有兴趣查看的硬件解决方案。
基于软件的方法可以是Lucene搜索引擎。
免费的 Microsoft 解决方案是Microsoft Search Server Express。与 SharePoint 中的搜索类似。
乔治,
听起来你很着急。
你最好开始设定对返工、返工、返工的期望。
我强烈建议您现在花时间
建立要求,可能是基本的、中间的和蓝天的
确定哪些搜索引擎、前端、爬虫等(开源或供应商提供)能够真正满足您的要求
确定对这些工具的可用支持,以及获得及时和可行的答案或变通方法的可能性(至少开源不是支持合同)
不要试图一次完成所有事情。先做最小的数据集,不管你的赞助商在管理上有多远。您不会花费数月的时间进行测试,只是为了发现系统或您的计划中的一个致命的大规模缺陷
通过为您的各个级别或要求创建路线图,与您的团队和赞助商沟通,并带有检查点
就中小型企业搜索项目的预先规划而言,我强烈推荐 Martin White 的“让搜索工作”。
我想你会发现排名和相关性是获得一个好的搜索解决方案最重要的部分之一。引擎可能提供类似的功能,但如何做到这一点的细节会有所不同,更重要的是,您在强制相关性方面取得的成功将仅部分取决于您选择的搜索引擎的功能。换句话说,如果您的文本与搜索引擎算法不一致,您将花费大量时间尝试理解各种调整参数及其组合。(目前我只熟悉2,欢迎其他人反驳)。
这是一次很棒的学习经历。祝你好运。
FAST 是一款出色的企业搜索产品。它通常在所有咨询公司的评估中名列前茅。不过,它确实需要适量的技术设置和支持。
谷歌是另一个可靠的产品,但它非常昂贵。它需要较少的技术支持,但也使您对搜索结果的控制较少。