3

我正在尝试使我的 AJAX 网站可抓取:

这是有问题的网站。

  • 我创建了一个生成页面的 htmlsnapshot.php(该文件需要传递哈希片段才能生成正确的内容)。
  • 我不知道如何让爬虫加载这个文件,同时让普通用户加载普通文件。
  • 我真的不明白爬虫对哈希片段做了什么(这可能是我的问题的一部分。)

有人有任何提示吗?

4

1 回答 1

2

爬虫会自行转移。您只需要配置您的 PHP 脚本来处理 Google 将向您的网站发送的 GET 参数(而不是依赖于 AJAX)。

基本上,当谷歌找到一个链接yourdomain.com/#!something而不是请求/和运行 JavaScript 来对数据发出 AJAX 请求时something,谷歌会自动(无需你做任何事情)将#!你的 URL 中的任何内容翻译为?_escaped_fragment_=something.

您只需要(在您的 PHP 脚本中)检查是否$_GET['_escaped_fragment_']已设置,如果已设置,则显示该值的内容something

这实际上很容易。

于 2012-05-06T07:23:42.007 回答