每个MediaWiki页面上的页面查看计数器似乎是识别热门页面的好方法,这些页面值得投入更多精力来保持最新和有用,但我遇到了一个问题。
我们使用Google Search Appliance来索引我们的 MediaWiki 安装。我遇到的问题是 GSA 每次抓取页面时都会增加页面查看计数器。这完全支配了统计数据,淹没了真实用户的观点。
我知道如何重置页面计数器以重新开始。但是有没有办法将 MediaWiki 配置为忽略来自 GSA 的页面请求以计算页面浏览量?
每个MediaWiki页面上的页面查看计数器似乎是识别热门页面的好方法,这些页面值得投入更多精力来保持最新和有用,但我遇到了一个问题。
我们使用Google Search Appliance来索引我们的 MediaWiki 安装。我遇到的问题是 GSA 每次抓取页面时都会增加页面查看计数器。这完全支配了统计数据,淹没了真实用户的观点。
我知道如何重置页面计数器以重新开始。但是有没有办法将 MediaWiki 配置为忽略来自 GSA 的页面请求以计算页面浏览量?
这可以通过在 Article.php 中添加条件来完成:
包括/Article.php:2861:function viewUpdates():
if( !$wgDisableCounters && !$wgUser->isAllowed('bot') && $this->getID() ) {
添加:
&& strpos($_SERVER['HTTP_USER_AGENT'], 'gsa-crawler') === false
其中 gsa-crawler 是默认 gsa UA 的一部分...
另一种方法是在 GSA 中设置表单身份验证,并让它以机器人组中的用户身份登录到维基媒体。
我们将此代码段添加到 LocalSettings.php,取得了巨大成功:
if (strpos($_SERVER['HTTP_USER_AGENT'], 'gsa-crawler') !== FALSE) {
$wgDisableCounters = TRUE;
}
谢谢!