0

今天早上,我的很多网站在其搜索结果中都被 Google 标记为“此网站可能已被入侵”。在我自己的 VPS 服务器上受我监督的网站。我对它进行了深度扫描,没有什么不寻常的。我已经寻找可疑的 htaccess 和 javascript 注入,到目前为止没有任何问题。

昨天,我把一个 htaccess 文件放到我的 web 根目录,以确保没有 sql、javascript、base64 和任何其他可疑的黑客解决方案可能攻击我的服务器。

所以我确实怀疑谷歌添加了“这个网站可能被入侵”,因为我在我的所有网站上都添加了这种保护。

有这个 htaccess 的内容:

RewriteEngine On
RewriteCond %{REQUEST_URI} !^/robots.txt
RewriteCond %{REQUEST_URI} !^/sitemap.xml

RewriteCond %{HTTP_USER_AGENT} ^-?$ [OR] 
RewriteCond %{HTTP_USER_AGENT} ^[bcdfghjklmnpqrstvwxz\ ]{8,}|^[0-9a-z]{15,}|^[0-9A-Za-z]{19,}|^[A-Za-z]{3,}\ [a-z]{4,}\ [a-z]{4,} [OR]
RewriteCond %{HTTP_USER_AGENT} ^<sc|<\?|^adwords|@nonymouse|Advanced\ Email\ Extractor|almaden|anonymous|Art-Online|autoemailspider|blogsearchbot-martin|CherryPicker|compatible\ \;|Crescent\ Internet\ ToolPack|Digger|DirectUpdate|Download\ Accelerator|^eCatch|echo\ extense|EmailCollector|EmailWolf|Extractor|flashget|frontpage|Go!Zilla|grub\ crawler|HTTPConnect|httplib|HttpProxy|HTTP\ agent|HTTrack|^ia_archive|IDBot|id-search|Indy\ Library|^Internet\ Explorer|^IPiumBot|Jakarta\ Commons|^Kapere|Microsoft\ Data|Microsoft\ URL|^minibot\(NaverRobot\)|^Moozilla|^Mozilla$|^MSIE|MJ12bot|Movable\ Type|NICErsPRO|^NPBot|Nutch|Nutscrape/|^Offline\ Explorer|^Offline\ Navigator|OmniExplorer|^Program\ Shareware|psycheclone|PussyCat|PycURL|python|QuepasaCreep|SiteMapper|Star\ Downloader|sucker|SurveyBot|Teleport\ Pro|Telesoft|TrackBack|Turing|TurnitinBot|^user|^User-Agent:\ |^User\ Agent:\ |vobsub|webbandit|WebCapture|webcollage|WebCopier|WebDAV|WebEmailExtractor|WebReaper|WEBsaver|WebStripper|WebZIP|widows|Wysigot|Zeus|Zeus.*Webster [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^curl|^Fetch\ API\ Request|GT\:\:WWW|^HTTP\:\:Lite|httplib|^Java/1.|^Java\ 1.|^LWP|libWeb|libwww|^PEAR|PECL\:\:HTTP|PHPCrawl|python|Rsync|Snoopy|^URI\:\:Fetch|WebDAV|^Wget [NC]
RewriteRule (.*) - [F]

RewriteCond %{REQUEST_METHOD} (GET|POST) [NC]
RewriteCond %{QUERY_STRING} ^(.*)(%3C|<)/?script(.*)$ [NC,OR]
RewriteCond %{QUERY_STRING} ^(.*)(%3D|=)?javascript(%3A|:)(.*)$ [NC,OR]
RewriteCond %{QUERY_STRING} ^(.*)document\.location\.href(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)(%3D|=)http(%3A|:)(/|%2F){2}(.*)$ [NC,OR]
RewriteCond %{QUERY_STRING} ^(.*)base64_encode(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)GLOBALS(=|[|%[0-9A-Z]{0,2})(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)_REQUEST(=|[|%[0-9A-Z]{0,2})(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)(SELECT(%20|\+)|UNION(%20|\+)ALL|INSERT(%20|\+)|DELETE(%20|\+)|CHAR\(|UPDATE(%20|\+)|REPLACE(%20|\+)|LIMIT(%20|\+))(.*)$ [NC]
RewriteRule (.*) - [F]

这个文件中有很多关于黑客术语的关键字......谷歌有什么办法可以调查 htaccess 文件吗?

我应该只为这个 htaccess 使用 robots.txt 阻止谷歌,还是可以/应该直接在 htaccess 中添加一行代码来阻止谷歌扫描这个文件......?

你怎么看 ?

4

1 回答 1

1

如果.htaccess从外面可以看到,那么你有一个严重的问题。任何通过 http 访问该站点的都不应看到该文件。在 robots.txt 中阻止它只会阻止行为良好的机器人查看它。但是忽略 robots.txt 的机器人仍然可以访问。

如果你怀疑你的 .htaccess 是问题的原因,你需要确保它不能被提供。这是 Apache 的默认设置,但如果你在使用权限,我想你可能已经暴露了它。如果你这样做了,你需要解决这个问题。

我认为您需要在其他地方寻找 Google 的“此站点可能已被入侵”消息的原因。在 [此站点可能已被入侵] 上进行的 Google(或 Bing)搜索会显示很多关于为什么会出现该警告的信息。

于 2013-03-07T23:04:17.570 回答