2

我们的一个 TYPO3 安装有问题。访问该站点的 Bingbot 不带参数地调用旧 ext_form 扩展的控制器并创建错误。

207.46.13.XXX - - [16/Oct/2018:00:18:48 +0200] "GET example.html?tx_form_form%5Baction%5D=process HTTP/1.1" 200 10256 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

对我们而言,问题不在于发生这种情况,而是 TYPO3 正在缓存站点,内容为“糟糕,发生错误!代码:20181016001848e0153dcf”。

有没有办法说 TYPO3 在发生错误时不缓存站点,或者如果他使用错误参数调用站点,则将机器人发送到 404 站点。

4

1 回答 1

1

您可以做几件事:

  • 排除带有参数的页面robots.txt编辑:经过考虑,此解决方案可能不适合特定问题)
  • 如果在没有必需参数的情况下调用页面,则重定向.htaccess,机器人也应该识别重定向。
  • 检查为什么机器人甚至在没有必需参数的情况下调用页面,也许你可以避免它。
  • bing 可以为特定的 URL 配置,这个页面可以作为你的起点。

编辑:
htaccess 示例(未测试):

RewriteCond %{QUERY_STRING} .+
RewriteRule ^example.html?tx_form_form%5Baction%5D=process$ example.html [L,R=301,QSD]

目标example.html可以是任何东西,可以是自定义 404 页面,也可以只是列表视图。301中的代码[L,R=301,QSD]可以根据HTTP 状态码 (3xx)进行调整。如果它被重定向到(自定义)4xx 页面,则 HTTP 状态代码应该是相应的(404或者可能是另一个 4xx-status-message 即400)。

于 2018-10-16T10:10:23.320 回答