3

我正在使用 FAST For SharePoint 来抓取非 SharepPoint 网站。网站抓取没有错误,我可以得到任何关键字的结果。

我想通过 html 页面元标记在结果页面上创建细化器。必须有两级精炼机;类别和子类别。如果用户点击类别,精简面板必须显示所有相关的子类别。

元标记如下:

<meta name="Category" content="Products"/>
<meta name="SubCategory" content="Electronic"/>

如何使用 FAST For SharePoint Webcrawler 提取抓取 html 页面的元标记?

我尝试将元标记名称添加到FAST Search Administration > Managed Properties并为这些元标记配置精简面板,但我无法获得结果。这没用。

谢谢!

4

1 回答 1

0

如果要使用自定义托管属性,则需要先将它们绑定到已爬网属性。爬取的属性是在爬取过程中自动创建的,或者您可以在 powershell 中创建它们,请参见以下链接: http: //msdn.microsoft.com/en-us/subscriptions/ff393776 (v=office.14).aspx

如果我理解得很好,那么您要做的是获取页面 HTML 中的信息。在这种情况下,您无法使用开箱即用的网络爬虫来获取此信息。我建议你看看自定义 BDC 连接器,如果你想创建一个自定义爬虫来获取你想要的信息:http: //msdn.microsoft.com/en-us/library/ee557349(v=office.14) .aspx

于 2013-03-05T18:32:23.203 回答