Google 等搜索引擎可以索引 JavaScript 生成的网页吗?当您在由 JavaScript(例如使用 GWT)生成的页面中右键单击并选择查看源代码时,您不会看到动态生成的 HTML。我想如果搜索引擎也看不到生成的 HTML,那么索引就没有太多了,对吧?
8 回答
您的怀疑是正确的 - 不能依赖 JS 生成的内容对搜索机器人可见。关闭 JS 的任何人也看不到它——而且,上次我在我正在开发的网站上添加了一些测试(这是一个大型的主流受众网站,每月有数十万独特的访问者) ,大约 10% 的用户没有以任何形式运行 Javascript。这包括搜索机器人、禁用 JS 的 PC 浏览器、许多手机、使用屏幕阅读器的盲人……等等。
这就是为什么通过 JS 生成的内容(没有回退选项)是一个非常糟糕的主意。
回归本源。首先,使用准系统 (X)HTML创建您的站点,基于类似 REST 的原则(至少在需要 POST 请求来更改状态的范围内)。简单的语义标记,忘记 CSS 和 Javascript。
第一步是做到这一点,并让您的整个网站(或尽可能多的网站)以这种方式很好地为搜索机器人和类似 Lynx 的用户代理工作。
然后添加一个视觉层:CSS/graphics/media 进行视觉润色,但不要显着改变您原来的 (X)HTML 标记;允许原始纯文本网站保持完整和正常运行。保持标记干净!
三是添加行为层:Javascript(Ajax)。为使用支持 Ajax 的 JS 的用户/浏览器提供更快、更流畅、更好的体验……但仅限于那些用户。仍然欢迎没有 Javascript 的用户;搜索机器人、视障者、许多手机等也是如此。
这在网页设计界称为渐进增强。这样做,您的网站就会以某种合理的形式为所有人服务。
如果搜索引擎也看不到生成的 HTML,则没有太多可索引的内容
大概就是这样总结。从技术上讲,没有什么可以阻止搜索引擎为其机器人/蜘蛛实现 javascript 引擎,但通常不会这样做。他们可以,但他们不会。
另一方面,您可以嗅探搜索引擎的用户代理并为其提供可读的内容。但是搜索引擎通常不喜欢这样,如果他们检测到与您发送到普通浏览器的内容不同,它们会非常严厉地惩罚您。
一个好的经验法则:如果你可以在Lynx中看到它,它就可以被 Google 索引。
Lynx 是一项出色的测试,因为它还可以让您了解盲人的屏幕阅读器也将如何查看您的页面。
是的,谷歌(很可能是必应)将索引动态生成的 HTML。在此处查看更多详细信息:http ://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157 。
谷歌正在努力执行简单的 Javascript 来发现一些内容——但他们肯定不会执行完整的脚本。如果您担心 SEO,那么您需要考虑提供静态版本的页面。
在 GWT 中有几种方法可以处理这个问题,这是关于这个主题的一个很好的讨论。似乎最好的选择是在用户代理是机器人时提供静态 SEO 内容,只要 SEO 内容与通过 GWT 路由提供的内容相同。这可能需要做很多工作,但如果您真的想要一个针对搜索引擎优化的完全丰富的 GWT 应用程序,那么它可能是值得的。
查看单页接口宣言,了解 SPI(AJAX 密集型)应用程序如何被 Google 和其他爬虫索引。难度取决于所使用的 Web 框架。
即使他们执行基本的JavaScript
MOSTLY WEBSITES Uses LIBRARIES
AND FRAMEWORKS
,我认为像 google bot 或任何其他蜘蛛这样的机器人也Js
不会加载与网页链接的文件,并且不加载它们的 JS 代码会产生错误。
/*Correct Me If I am wrong*/