3

几个月来,我们的 IIS/ColdFusion 服务器在 Google 爬虫扫描期间一直抛出 404 错误。通常很容易找到这些文件,但在这种情况下,Google 正在尝试扫描我们的 CFC 文件。这些文件确实存在,但它们不暴露给 Internet - 只暴露给 ColdFusion 服务器。尽管如此,谷歌还是在我们网站的某个地方看到了指向 CFC 的链接,并正在努力追踪它们。

下面是我们在 404 中的一个 CGI 结构的转储。 baseCFC是一个 CF 映射到D:\Domains\[domain]\cfc. 我们源代码中的所有引用baseCFC要么在<cfajaxproxy>标签中,要么CreateObject()在 Application.CFC 中的调用中(示例如下)。

或许这是一个重要的线索:baseCFC指的是D:\Domains\[domain]\cfc,但 Google 正试图到达D:\Domains\[domain]\www\baseCFC,这是我们网站的主目录。显然,Google 将baseCFC其视为服务器上的普通(未映射)目录并希望对其进行扫描。

在此处输入图像描述

baseCFC以下是我们代码中两种引用类型的示例:

<cfajaxproxy>:

<cfajaxproxy cfc="baseCFC.Misc" jsclassname="ajxMisc">

创建对象():

<cfscript>
  request.Misc = CreateObject( "component", "baseCFC.Misc" );
</cfscript>

我们如何解决这些与 CFC 相关的 404 错误?谢谢!

4

1 回答 1

12

创建的 javascriptcfajaxproxy包括 cfc 的位置。查看页面的源代码,您应该能够找到该字符串'/baseCFC/Statement.cfc'。这就是谷歌找到它们的方式。

让 Google 忽略它们的一种快速方法是修改您的robots.txt文件以排除baseCFC“目录”。

User-Agent: *
Disallow: /baseCFC/
于 2012-10-15T16:35:43.013 回答