我有一个 Drupal 网站,其页面由 Google Mini 搜索设备索引。
本周早些时候,我注意到一堆链接被标记为索引,但被排除在外,因为有一个“打印此页面”链接返回到同一页面并且有一个 rel="nofollow"。两天前,我把nofollow 拿出来,让GSA 重新索引该网站。
现在,有问题的页面在 GSA 中被标记为已编入索引,但它们并未显示在网站的搜索结果中。
我可以在 /search/google_appliance/TERM 进行搜索,但它们没有出现。当我搜索其他术语时,它们确实出现了。换句话说,我知道 GSA 正在工作。
当我在 /search/node/TERM [Drupal 默认搜索] 进行搜索时,我得到了不同的 Drupal 结果[显示了该术语的页面]。这让我很确定我正在击中 GSA。
关于为什么新编入索引的页面没有出现在 GSA 搜索中的任何想法?
编辑/已解决:有几个问题。以前,搜索使用 xslt 来处理它如何显示页面,以及当您点击提交时它在页面上发送查询的位置(在设备上,而不是网站上的提交按钮)。查询字符串以旧格式传递给站点,然后给出 404(就像您搜索 bookstore.site.com 和 origin.site.com 一样)。更多的是“无法从这里到达那里”之类的问题,而不是与搜索有关的任何问题。我删除了 xslt,所以它只使用了默认的 google 外观,让我们可以对设备的数据库进行很好的通用搜索。
但是,仍然返回了一些 Drupal 模块无法解析的奇怪搜索结果,并且日志被 simplexml_load_string() [function.simplexml-load-string]: ^ in \sites\all\modules\google_appliance\GoogleMini .php 在第 318 行。
我尝试了一些查询字符串变量并注释掉设置输出编码的行,一切似乎都有效。有问题的行位于第 322 行的 google_appliance.module 中:
$gm->setOutputEncoding('utf8');