我正在使用基于 SharePoint Server 2007 Enterprise 的 Microsoft Search Server 2008 和 Windows Server 2008 Enterprise。我想知道是否有任何方法(一些开放的 API 或 Web 服务或一些黑客方式)来检索爬取的页面内容?抓取来源是网站。
提前谢谢,乔治
我正在使用基于 SharePoint Server 2007 Enterprise 的 Microsoft Search Server 2008 和 Windows Server 2008 Enterprise。我想知道是否有任何方法(一些开放的 API 或 Web 服务或一些黑客方式)来检索爬取的页面内容?抓取来源是网站。
提前谢谢,乔治
“爬网内容”是什么意思?听起来您想知道爬取的内容是否存储在 MS Search Server 中?如果是这样,则不是。
虽然我不知道 MSS 的内部算法等是如何工作的,但它是基于 MOSS 的搜索,而 MOSS 的搜索又使用“MS Desktop Search 中引擎的调整版本”。只有索引存储在搜索服务器中。
可以在此处找到有关 MOSS(以及 MSS)中的索引如何工作的更多信息。