16

我在 Web 应用程序中收到了几个请求,这些请求在我的代码不应该生成的方式上基本上是错误的……主要是对 .ashx 的请求,没有指定任何 GET 参数。

用户代理是“Mozilla/4.0”(仅此而已) IP 每天都在变化。

这是一个机器人,对吧?

谢谢!

4

5 回答 5

10

很抱歉碰到老问题,但我认为这是中国防火墙使用的机器人。他们抓取网页内容,并进行审查。

检查您的日志,看看是否有类似“GET /cert/bazs.cert”的内容。

100%确定是否找到。

于 2012-07-09T14:58:48.620 回答
9

这对我来说似乎很奇怪。任何合法的机器人都会以您可以识别的方式识别自己。任何恶意机器人都能够做得更好,使用户代理看起来像一个普通的浏览器。这是在中间的某个地方。再加上糟糕的要求,让我相信你正在处理陈旧的无能。

无论哪种方式,您都可能希望对这些请求进行 404 处理,而不是返回黄屏错误。

于 2009-05-07T14:26:03.663 回答
5

根据http://www.user-agents.org的“雅虎思维:意图驱动搜索”机器人报告了这一点。

但是,是的,它不会是浏览器报告的。

于 2009-05-07T14:33:13.193 回答
1

我已经在几个网站上实现了 asp.net 端请求跟踪,通过查看记录我可以说只有用户代理“Mozilla/4.0”可以由以下任何原因产生:

  • 无能
  • 搜索机器人
  • 攻击机器人

有趣的是,我的第一个Android被识别为“Safari 3.0”,最新的Android被识别为“Mozilla 0”!因此,很难将无能指向特定的软件生成。

对每个此类请求返回 404 可能不是搜索机器人的最佳方法,特别是如果这是内容频繁更改的公共网站。

另一方面,您应该知道,WebResource.axd目的地无效的请求指向跨站点脚本攻击。在这种情况下,建议使用 SanitizerProvider。您可以在Cross-site_scripting上阅读有关此类攻击的更多信息。

识别攻击的另一个好处是查看 IIS 日志文件,这些文件通常位于 [系统根目录]:\inetpub\logs\LogFiles\W3SVC1。这是我用于解析 IIS 日志文件的工具的片段:

在此处输入图像描述

在这种情况下,用户代理不是问题,通过从 2 个不同的 IP 请求“/dbadmin/index.php”来识别机器人攻击。攻击机器人正在寻找几个文件/页面。

希望这有助于并为这个问题提供额外的价值。

于 2012-12-19T08:11:42.347 回答
1

这些请求是对您自己编写的现有页面的请求,还是得到 404?

在后一种情况下,它可能是某种扫描攻击,试图在利用漏洞攻击它们之前检测易受攻击的应用程序实例。

于 2009-05-07T14:33:22.723 回答