确保设置了所有正确的索引选项后,我的 SP2010 开发安装仍然没有搜索 word 文档的内容,只搜索标题。有什么建议么?
问问题
118 次
1 回答
0
您的爬虫帐户是否有足够的权限来访问附加到列表项的文件?您是将网站作为 SharePoint 网站还是网站进行爬网(在这种情况下,您需要确保有指向文档的链接。
您是否没有 robots.txt 文件作为您的 Web 应用程序的根目录,该文件可能具有阻止内容被正确抓取的排除规则?
如果您真的想知道爬虫在工作时发生了什么,您可以在您的开发机器上安装 fiddler,并将您的搜索服务应用程序的代理设置更改为由 fiddler 创建的代理设置。这样做将允许您实时检查当前正在抓取的 url/内容以及返回的 http 状态代码以诊断权限/内容问题。
希望它有所帮助。
于 2012-04-08T19:55:22.397 回答