0

我需要 xml 文件来索引我的网站以进行谷歌抓取。我正在使用一些软件来制作 XML 文件。我的问题是我是否需要列出所有动态页面。我的意思是这样的:

http://mysite.com/page/?id=01
http://mysite.com/page/?id=02
http://mysite.com/page/?id=03
http://mysite.com/ page/?id=04
http://mysite.com/page/?id=05

如果是,那是为什么?如果我不包括它们并只是说:

http://mysite.com/page/

如果我包含所有 id,结果将是一个巨大的 XML 文件。谷歌接受这么大的文件还是有限制?

提前感谢所有帮助和时间。

4

3 回答 3

1

无论如何,Google 不会将您的所有动态页面编入索引。即使您将它们放在 sitemap.xml 中,它也会将它们中的许多扔掉。内容会太相似。

sitemap.xml 中的条目数量是有限制的,它曾经是 ~50k pages/10MB。根据我的经验,如果它们看起来太相似并且没有入站链接,Google 会抓取几千个并停止。

于 2011-01-24T22:56:59.827 回答
0

您根本不需要 XML 站点地图。它只是让谷歌更容易抓取你的内容。显然你不必在里面放动态的东西。

于 2011-01-24T22:45:42.500 回答
0

如果这是一个真正的问题,请尝试阅读rel="canonical"将这些类型的页面从 Google 中排除的内容。虽然它的用处取决于用例,但您可能会发现它是适合您的解决方案。

http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=139394

于 2011-01-24T22:50:54.837 回答