我刚刚实现了ajax爬取,我的网址是:http ://acs-germany.de/#!en/homepage 该网站刚刚被索引,我在这里查看搜索结果: https://www .google.at/#hl=en&q=+site:acs-germany.de+acs-germany.de
您会注意到被编入索引的 URL 包含 "fragments" 。这是我系统上存在的一个文件夹,其中包含“ajax”(或更好的 dhtml)内容的 HTML 快照。当跟踪该 URL 时,会提供快照,这反过来又会破坏应用程序,因为应用程序在半生不熟的标记之上被实例化,从而使站点 FUBAR。
我使用的是 apache,我与 URL 重写相关的规则如下:
Options -MultiViews
#Rewrite queries from google to the right files
RewriteEngine On
RewriteCond %{QUERY_STRING} ^_escaped_fragment_=(.*)$
RewriteRule ^(.*) http://acs-germany.de/fragments/%1.html?
直截了当:该站点位于http://acs-germany.de,当 JS 处于活动状态时,它会设置一个 hashbang,将浏览器的位置指向http://acs-germany.de/#!en/homepage 。在这个程度上,我期望带有 hashbangs 的 url 是被谷歌索引的,而不是重写的 URL。
这里可能是什么问题?