问题标签 [googlebot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
436 浏览

javascript - Googlebot 和 javascript

我的问题是 googlebot 是否可以跟踪通过 javascript onchange 函数重定向的页面:

例子:

现在,googlebot 会被重定向到 page2 还是 page1?

0 投票
1 回答
121 浏览

zope - 如何阻止 GoogleBot 查找获取 URL?

我使用标准的简单重写规则在 zope 2(多个虚拟主机)前面有 apache。

我在托管的一些旧网站和 googlebot 上遇到了大问题。

说我有:

  • site.example.com/documents/
  • site.example.com/images/i.jpg
  • site.example.com/xml/
  • site.example.com/flash_banner.swf

如何阻止以下情况发生?

  • site.example.com/documents/images/xml/i.jpg
  • site.example.com/images/xml/i.jpg
  • site.example.com/images/i.jpg/xml/documents/flash_banner.swf

所有响应都来自 URI 末尾的最后一个文件夹中的正确对象,旧站点编写得不是很好,在某些情况下,Google 会进出数百个不存在但总能找到的文件夹结构排列大闪存文件。因此,Googlebot 不会一次访问 Flash 文件,而是将其从网站上拖出数千次。我正在将旧站点移至 Django。但我需要在 Zope 中停止它。过去曾尝试过 ipchains 和 mod_security,但这次它们不是一个选项。

0 投票
2 回答
2296 浏览

asp.net-mvc - Googlebot 可以访问 MVC2/3 ChildActionOnly 控制器方法吗?

如果这个问题已经有几个月了,并且认为我在应用程序的早期版本中向 Googlebot 展示了该控制器方法。但是最近添加了新的-LatestNews也标有[ChildActionOnly]属性

问题 Elmah 有时会遇到以下异常:

我有以下行动声明(当然有点简化)

并且 View 是这样调用的:

我想知道谷歌如何找到那个子动作。我从来没有部署过没有 ChildActionOnly 的版本

我将不胜感激任何帮助!

0 投票
1 回答
171 浏览

joomla - 如何告诉谷歌该目录不再存在?

我基于 Joomla 创建了与健康相关的网站。我创建了 Google 网站管理员帐户,并查看了 Google 如何为我的网站编制索引。但后来我看到谷歌索引了一些目录/includes(我没有创建),哪些内容与健康主题相去甚远。我删除了这个目录,但已经有 2 个月的时间谷歌网站管理员显示 /includes 目录中的热门关键字。

我应该怎么做才能告诉 Google 该目录不再存在?

先感谢您。如果您需要,这里是网站地址:http ://healthfount.com

0 投票
1 回答
206 浏览

ruby-on-rails - 忽略 Rack::Cache 的 googlebot?

我正在使用Rack::Cache,谷歌搜索机器人触发了我所有的缓存未命中,所以我的缓存总是充满了实际上并不代表我网站上最受欢迎的页面,我似乎找不到如何忽略 IP 或用于缓存的用户代理,以前有人遇到过这个问题吗?

0 投票
1 回答
513 浏览

pagination - 光标+分页和搜索引擎优化

我想知道是否可以使用游标进行分页并同时保持这些页面针对 SEO 进行优化。

使用偏移量,给谷歌机器人一些关于深度的信息,游标不是这样:

我应该只将它们用作参数吗?

0 投票
1 回答
321 浏览

google-analytics - googlebot 访问我的谷歌分析虚拟网页浏览 URL

对于我网站上的一组页面,我向谷歌分析发送一个虚拟页面浏览量。因此,作为示例,我不是使用 /username 来跟踪页面,而是使用 /profile/username 使用谷歌分析来跟踪它,如下所示:

看起来效果很好。除了我在以 googlebot 作为用户代理的网站日志中看到大量上述虚拟 URL 之外!为什么谷歌访问我的虚拟网址?我在上面做错了吗?这是正常的吗?

0 投票
1 回答
1343 浏览

php - PHP 警告:preg_match() [function.preg-match]:未知修饰符

任何人都知道为什么会出现这种情况?尝试使用它来基于用户代理重定向用户。当用户代理是搜索机器人时会出现此警告。Windows XP MSIE 8 用户代理也被错误地重定向。

“警告:preg_match() [function.preg-match]:第 36 行 /.../getos.php 中的未知修饰符 'c'”

0 投票
2 回答
840 浏览

jquery - 阻止 Googlebot 运行函数

我们在我们的网站上实施了新的访问次数功能,当访问我们网站上的公司资料时,它会在我们的视图数据库中保存一行。这是使用每次加载页面(公司简介)时运行的服务器端“/addVisit”函数完成的。不幸的是,这意味着我们昨晚有超过 400 次来自 Googlebot 的访问。

由于我们确实希望 Google 将这些网页编入索引,因此我们无法使用 robots.txt 在这些网页上排除 Googlebot。

我还读到使用 jQuery $.get() 运行此函数不会停止 Googlebot。

唯一可行的解​​决方案是排除已知的机器人 IP 还是有选项?

或者可能使用带有 robots.txt exclude /addVisit 的 jQuery $.get(/addVisit) 会阻止 googlebot 和其他机器人运行此功能?

0 投票
1 回答
207 浏览

ajax - 我的 AJAX 内容是否已经可以抓取?

我已经建立了一个基于 Ajax 导航的网站。

我是这样构建的,每当没有 javascript 的人访问我的网站时,通常通过 Ajax 加载内容的导航链接就像普通链接一样,用户可以像往常一样浏览页面。

由于 Google bot 不运行 javascript,理论上它应该能够像往常一样浏览所有链接和相应的站点,对吧?因为它们是带有指向相应站点的 href 标记的有效链接。

现在我想知道这是否足够,或者我是否也需要从谷歌植入这种方法以确保谷歌看到我的所有内容?

感谢您的见解,并原谅我的英语不好!