2

我有一个非常独特的情况,我认为这里的任何其他主题都无法与之相关。

我有一个动态加载/嵌入到第三方网站的电子商务模块,没有将 iframe 直接 JSON 到 Web 客户端的内容。我根本无法访问这些第三方网站,除了从他们的页面加载我的 javascript 文件并动态生成内容。

我知道#! 方法,但这在这里不好,我的 JS 确实在嵌入式平台内生成“url”,但它们是假的,仅用于地址栏,我不相信谷歌爬虫可以达到这么远。

所以我的问题是,是否有一个元数据我们可以设置为指向 url 之外,即返回到我的服务器并带有静态可抓取内容。即,将规范指向我的服务器......但我再次认为这行不通。

4

3 回答 3

3

如果你执行 #! 那么您必须确保嵌入的 url 支持片段参数版本,而您可能无法做到这一点。这是服务器端的东西。

您可能也无法影响页面的规范标签。它再次必须在服务器端完成。您通过 JavaScript 设置的任何元标记都不会被机器人看到。

Disqus 通过提供 API 解决了这个问题,因此嵌入网站可以到达评论服务器端,然后以纯 html 呈现。WordPress 有一个插件可以做到这一点。Disqus 也是 Google 研究出如何抓取其 AJAX 页面的少数系统之一。

一些插件要求人们还包括一个带有 JavaScript 的普通链接。请注意这一点,因为如果您做错了,您可能会违反 Google 指南。但是您可以将纯链接与您的插件集成,以便它将机器人和用户引导到内容的可抓取版本。

于 2013-03-02T16:11:57.710 回答
1

查看Google 的可抓取 ajax 标准(以及为什么这是一个坏主意)和规范 URL

于 2013-03-02T02:02:23.390 回答
0

现在你可以真正做到这一点。可以在此处找到完整的指南和示例:https ://github.com/kubrickology/Logical-escaped_fragment

于 2014-12-06T21:20:14.407 回答