在我们基于 WordPress 构建的网站中,我们将自定义帖子类型之一的名称从“A”更改为“B”,并更改了几个类别的层次结构。
现在,问题是 google 正在索引/抓取旧的“A”CPT 名称以及旧的类别结构,这会导致随机页面(因为 WordPress 会猜测并在 URL 中显示带有这些关键字的页面)或 404 错误。
我们可以做些什么(通过网站管理员工具)让谷歌重新索引我们的整个网站并开始尊重我们的新结构?谢谢。
在我们基于 WordPress 构建的网站中,我们将自定义帖子类型之一的名称从“A”更改为“B”,并更改了几个类别的层次结构。
现在,问题是 google 正在索引/抓取旧的“A”CPT 名称以及旧的类别结构,这会导致随机页面(因为 WordPress 会猜测并在 URL 中显示带有这些关键字的页面)或 404 错误。
我们可以做些什么(通过网站管理员工具)让谷歌重新索引我们的整个网站并开始尊重我们的新结构?谢谢。
以下是谷歌索引政策的简要说明:
过程
抓取过程从网站所有者提供的过去抓取的网址列表和站点地图开始。当 Google 爬虫访问这些网站时,他们会寻找其他页面的链接以供访问。该软件特别关注新站点、现有站点的更改和死链接。
计算机程序确定要抓取的站点、从每个站点获取的频率和页面数量。Google 不接受付款以更频繁地为您的网络搜索结果抓取网站。他们更关心获得尽可能好的结果,因为从长远来看,这对用户和他们的业务都是最好的。
网站所有者的选择
大多数网站不需要为抓取、索引或服务设置限制,因此他们的页面有资格出现在搜索结果中,而无需做任何额外的工作。
也就是说,对于 Google 如何通过 网站管理员工具和名为“<a href="https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag ?hl=en" rel="nofollow noreferrer">robots.txt"。使用该robots.txt
文件,网站所有者可以选择不被抓取,Google bot
或者他们可以提供有关如何处理其网站上的页面的更具体的说明。
网站所有者有精细的选择,可以选择如何逐页索引内容。例如,他们可以选择不使用片段(搜索结果中标题下方显示的页面摘要)或缓存版本(存储在 Google 服务器上的备用版本,以防实时页面不可用)显示他们的页面。网站管理员还可以选择使用自定义搜索将搜索集成到他们自己的页面中。