2

我最近继承了一个 Drupal 5 站点,并进行了一系列改进。其中有几个围绕搜索结果展开。

  1. 未发布的页面出现在搜索引擎结果中。其中一些是旧页面,另一些是最近未发布的。所有都在 CMS 中正确标记为未发布,并且仍在显示。

  2. 过时的页面从搜索引擎中显示出来。URL 路径结构已更改,这些项目是数据库中的旧结果。

据我所知,该站点使用 Google Search Appliance(GSA) 进行搜索,而不是默认的 Drupal 搜索。除了看到启用的模块之外,有没有办法可以确定它正在使用 GSA?

如果是 GSA,我似乎可以让有权访问 GSA 的人重建网站上的搜索结果。它是否正确?

如果重建搜索结果是正确的方法,那么每当从网站上删除大量内容时,我都需要找人重建搜索。有没有更好/自动的方法?

4

4 回答 4

1

听起来像是处理搜索的drupal。Google 需要数据库访问权限才能显示未发布的节点。可能是您正在使用视图进行搜索,但忘记只获取已发布的节点。

如果 Drupal 正在处理搜索,您只需刷新并重建搜索索引。如果您没有太多内容,这可以轻松完成。

于 2009-10-23T20:02:13.827 回答
1

GSA 可能仍会显示已删除的内容,具体取决于您的数据源。

如果内容来自数据库提要,然后从查询中删除,它将被删除。如果内容来自自然爬网或通过自定义连接器提要,则不会在删除时从索引中删除。相反,它需要自然地循环出索引,这可能需要一段时间。

阻止显示已删除 url 的一种方法是通过前端进行。在 GSA 管理界面中,转到服务 > 前端,然后选择您的前端并单击删除 URL 选项卡。您可以列出您的网址或通过正则表达式阻止一组网址。

于 2009-11-24T20:12:31.663 回答
0

我已经发布了关于节点访问的更一般问题的答案。您的搜索结果的问题很可能与此有关。

于 2009-10-24T13:01:40.577 回答
0

为了使 Google Appliance 保持最新状态,您可以尝试XmlSiteMap,这是一个为您的所有内容发布适当的 xml 站点地图的模块。

对于在线网站,发布站点地图是让搜索引擎保持最新状态的好方法,因为他们可以使用它来了解新页面并清除旧页面。我假设 Google Appliance 也会使用它。

于 2009-10-28T21:30:29.567 回答