3

每个MediaWiki页面上的页面查看计数器似乎是识别热门页面的好方法,这些页面值得投入更多精力来保持最新和有用,但我遇到了一个问题。

我们使用Google Search Appliance来索引我们的 MediaWiki 安装。我遇到的问题是 GSA 每次抓取页面时都会增加页面查看计数器。这完全支配了统计数据,淹没了真实用户的观点。

我知道如何重置页面计数器以重新开始。但是有没有办法将 MediaWiki 配置为忽略来自 GSA 的页面请求以计算页面浏览量?

4

2 回答 2

3

这可以通过在 Article.php 中添加条件来完成:

包括/Article.php:2861:function viewUpdates():

if( !$wgDisableCounters && !$wgUser->isAllowed('bot') && $this->getID() ) {

添加:

&& strpos($_SERVER['HTTP_USER_AGENT'], 'gsa-crawler') === false

其中 gsa-crawler 是默认 gsa UA 的一部分...

另一种方法是在 GSA 中设置表单身份验证,并让它以机器人组中的用户身份登录到维基媒体。

于 2010-01-19T19:22:46.647 回答
3

我们将此代码段添加到 LocalSettings.php,取得了巨大成功:

if (strpos($_SERVER['HTTP_USER_AGENT'], 'gsa-crawler') !== FALSE) {
  $wgDisableCounters = TRUE;
}

谢谢!

于 2010-01-19T22:24:38.117 回答