我想阻止我网站上的所有机器人(如 HTTrack)。通常,我会使用 .htaccess 文件通过 .htaccess 文件来阻止机器人RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR]
。
但是,我的服务器正在运行 Node.js Express。如何获取 HTTP_USER_AGENT 并在 Node.js 上执行块或重写?
我想阻止我网站上的所有机器人(如 HTTrack)。通常,我会使用 .htaccess 文件通过 .htaccess 文件来阻止机器人RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR]
。
但是,我的服务器正在运行 Node.js Express。如何获取 HTTP_USER_AGENT 并在 Node.js 上执行块或重写?
有一个中间件,称为express-nobots:
var noBots = require('express-nobots');
// must be the first middleware
app.use(noBots());
您可以在源文件中看到被阻止的机器人列表。