2

[明智的注意:跳到最后一个编辑]

我有一个非常简单的 txt 站点地图(名为 sitemap.txt),如下所示:

http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html

当我在网站管理员工具上加载它时,我得到:

站点地图是 HTML - 您的站点地图似乎是一个 HTML 页面。请改用支持的站点地图格式

我尝试了一些替代方案(例如有或没有 www),但没有运气。

任何人有任何线索?

任何帮助表示赞赏!

编辑

我尝试使用 xml 站点地图并得到相同的错误,因此看起来服务器将所有内容都作为 HTML 提供(正如 ceejayoz 正确建议的那样)。现在的问题是......我如何让 apppot 服务器将文本作为纯文本服务器

编辑:

好的 - 我受够了并实现了一个 servlet 来将我的站点地图(我现在正在尝试使用 XML 和 TXT)明确地作为文本/纯文本提供服务。如果我手动调用 servlet 但仍然获得 Sitemap 是 HTML,一切正常。我不知道在哪里敲我的头!

编辑: 我尝试使用 firefox 插件验证内容类型 - 一切似乎都按预期进行(我正在放置实际的 URL,以便人们可以查看):

http://wokheisandbox.appspot.com/sitemaps/sitemap.txt --> 内容类型:text/plain http://wokheisandbox.appspot.com/sitemaps/sitemap.xml --> 内容类型:application/xml

使用我的 servlet(明确设置 text/plain): http ://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType= TXT --> Content-type: text/plain http://wokheisandbox.appspot.com/wokhei/ serveSitemap?fileType=XML --> 内容类型:文本/纯文本

我从网站管理员工具中得到的仍然是 --> Sitemap is HTML

编辑

我想我找到了原因——>我在谷歌网站管理员工具上注册了我的网站http://mydomain.com但该应用程序托管在 apppot 上的http://myapp.appspot.com映射到 mydomain.com . 如果我注册http://myapp.appspot.com一切正常(站点地图验证)。

这是个好消息,但并不理想,因为我希望 mydomain.com 被编入索引......关于如何克服的任何想法?

4

5 回答 5

5

听起来您的网络服务器正在提供.txt文件text/html而不是text/plain.

对于 Apache,.htaccess 文件中的以下内容应该可以修复它:

AddType text/plain .txt
于 2009-08-03T18:47:52.517 回答
1

我发现这个线程讨论了导致最近站点地图悲伤的重复条目。我在您的站点地图中没有看到这个问题,但您不希望条目之间有任何重复。例如,确保您的站点地图不包含以下两项:

http://mydomain.com/ or http://www.mydomain.com/

AND

http://mydomain.com/index.html or http://www.mydomain.com/index.html

我认为您发布了整个站点地图,因此,我不认为这完全是您的问题。您确实提到您已经尝试了各种网址(有和没有 www)。如果您通过 Google WebMaster Tools 验证站点地图,可能需要长达 20 分钟才能使更正生效。我希望它有所帮助。

于 2009-08-03T18:55:47.807 回答
0
<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
    <url>
        <loc>http://myDomain.com</loc>
    </url>
    <url>
        <loc>http://myDomain.com/about.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/faq.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/careers.html</loc>
    </url>
</urlset>

这种方式总是对我有用。

于 2009-08-10T18:15:56.527 回答
0

以防万一您对非 xml 站点地图改变主意:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.test.com/</loc>
    <lastmod>2009-08-03T23:40:40+00:00</lastmod>
    <changefreq>daily</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://test/</loc>
    <lastmod>2009-08-03T23:59:08+00:00</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.6</priority>
  </url>
</urlset>
于 2009-08-10T18:18:06.540 回答
-1

我相当确定您需要提供 XML 格式的站点地图文件 (sitemap.xml)。有关格式示例,请参见此处: http ://en.wikipedia.org/wiki/Sitemaps 。

于 2009-08-03T18:48:35.417 回答