问题标签 [search-engine-bots]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

48 问题

0 投票

4 回答

3343 浏览

asp.net - 允许搜索机器人在没有会话 ID 的情况下抓取您的网站

谷歌的网站管理员指南状态

允许搜索机器人在没有会话 ID 或跟踪其在站点中的路径的参数的情况下抓取您的站点。这些技术对于跟踪个人用户行为很有用，但机器人的访问模式完全不同。使用这些技术可能会导致您网站的索引不完整，因为机器人可能无法消除看起来不同但实际上指向同一页面的 URL。

我的 ASP.NET 1.1 站点使用自定义身份验证/授权，并且非常依赖会话 guid（类似于这种方法）。我担心允许非会话跟踪流量会破坏我现有的代码或引入安全漏洞。

允许非会话跟踪机器人爬取正常会话跟踪的站点有哪些最佳实践？除了检查用户代理之外，还有什么方法可以检测搜索机器人（我不希望人们把自己伪装成 googlebot 来绕过我的会话跟踪）？

2010-02-04T21:37:04.137

0 投票

1 回答

490 浏览

web-crawler - robots.txt 文件中的允许和禁止

我想禁止 SE 机器人访问我网站上的所有文件和文件夹，但其中的特殊文件夹和文件除外。我可以在 robots.txt 文件中使用这些行吗？

这样对吗？

web-crawler robots.txt search-engine-bots

2010-07-24T06:30:24.397

0 投票

4 回答

4695 浏览

search-engine - Google 爬虫找到 robots.txt，但无法下载

谁能告诉我这个 robots.txt 有什么问题？

http://bizup.cloudapp.net/robots.txt

以下是我在 Google 网站管理员工具中遇到的错误：

实际上，上面的链接是执行机器人动作的路线的映射。该操作从存储中获取文件并将内容作为文本/纯文本返回。谷歌表示他们无法下载该文件。是不是因为这个？

search-engine search-engine-bots

2010-08-19T16:40:17.283

0 投票

2 回答

273 浏览

css - 使用 Javascript 解决 SEO 问题

我想知道在哪个阶段可以开始使用 Javascript 操作 HTML 元素/内容以免损害 SEO？

我在某处读到，使用 CSS 属性隐藏的 HTML 内容display:none经常受到谷歌爬虫的惩罚，这有充分的理由让我相信......我问这个是因为我打算有一些最初隐藏的 div 面板，但在用户单击适当的链接后显示。因此，我的意图不是完全向用户隐藏内容——只是为了给他们更好的用户体验——我担心谷歌可能不会这么看！

我这样做的原因是为了防止在我的 Javascript 进入位置、隐藏和整理所有内容之前出现可怕的无样式 html 元素（定位）的瞬间（或在某些情况下，整整 2 秒）。因此，display:none在最前面添加，然后使用 Javascript 来切换可见性本来是理想的，但显然是谷歌搜索引擎机器人的禁忌。

各位专家有什么建议吗？谢谢！

css seo search-engine-bots

2010-08-30T21:56:02.960

0 投票

3 回答

105 浏览