42

如何找到网站的 sitemap.xml 文件?

例如,去 stackoverflow/sitemap.xml 得到一个 404。

在 stackoverflow/robots.txt 中写了以下内容:

“这在技术上是无效的,因为出于某些不可原谅的原因,站点地图路径必须是绝对的,而不是相对的。站点地图:/sitemap.xml”

4

5 回答 5

98

没有标准,所以不能保证。话虽如此,站点地图通常在根目录上进行自我标记,如下所示:

example.com/sitemap.xml

在某些服务器上区分大小写,因此请记住这一点。如果不存在,请查看根目录下的 robots 文件:

example.com/robots.txt

如果您没有在 robots 文件中看到它,请前往 Google 并搜索:

site:example.com filetype:xml

这会将结果限制为目标域上的 XML 文件。在这一点上,它会根据您正在使用的网站的具体情况进行反复试验。如果您从上面的 Google 搜索短语中获得了几页结果,请尝试进一步限制结果:

filetype:xml site:example.com inurl:sitemap

或者

filetype:xml site:example.com inurl:products

如果您仍然找不到它,您可以right-click > "View Source"搜索(又名:“控制查找”或Ctrl + F.xml以查看代码中是否有对它的引用。

于 2013-06-06T04:44:35.483 回答
20

我认为站点地图的位置没有标准。这就是为什么您在使用 Google 的网站管理员工具添加站点地图时应该为站点地图指定任意 URL 的原因。

于 2012-04-19T16:50:18.690 回答
3

站点地图的位置会影响它可以包含哪些 URL,但除此之外没有标准。这是一个很好的链接,有更多解释:http ://www.sitemaps.org/protocol.html#location

于 2012-06-28T21:17:31.913 回答
2

根据协议文档,网站设计人员至少可以使用三个选项将 sitemap.xml 位置通知给搜索引擎:

  • 通过提供的界面通知每个搜索引擎该位置
  • 将 url 添加到 robots.txt 文件
  • 通过http向搜索引擎提交url

因此,除非他们选择在 robots.txt 文件中发布站点地图位置,否则您无法真正知道他们将 sitemap.xml 文件放在哪里。

于 2013-03-21T18:23:04.483 回答
2

使用 Google 搜索运算符为您找到它

用下面的代码搜索谷歌..

inurl:domain.com filetype:xml 点击这里查看站点地图搜索示例

将 domain.com 更改为您要查找站点地图的域。这应该列出为给定域列出的所有 xml 文件.. 包括所有站点地图 :)

于 2019-02-01T09:57:13.153 回答