让我们看一个网站,其中所有内容都加载到一个页面上。大多数内容被 隐藏<div style="display:none">
,但在用户单击某些元素时由 javaScript 呈现为可见。
然而,由于并非所有人都使用 javaScript,因此内容也可以在页面重新加载时呈现可见,这要归功于 PHP。像这样:www.example.com/content1.php 或 www.example.com/content2.php。
例如单击第一个链接将返回:<div class="content1" style="display:inline">We provide banking services</div><div class="content2" style="display:none">We also make great hot-dogs.</div>
相反,单击第二个链接将返回:
<div class="content1" style="display:none">We provide banking services</div><div class="content2" style="display:inline">We also make great hot-dogs.</div>
因此,换句话说,所有内容总是加载到页面上。考虑到搜索引擎爬虫,我应该在站点地图文档中包含这两个 URL,还是会被视为“欺骗”搜索引擎?像这样:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/content1.php</loc>
<lastmod>2008-01-01</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.example.com/content2.php</loc>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
或者它对搜索引擎优化甚至更重要的是,搜索结果中可以看到哪些片段?
如果有人碰巧真的很喜欢这些东西,如果有一个命名的锚标记,内容显示在网站上怎么办?那么在站点地图文档中包含哈希标签是否合适,如下所示:
<loc>http://www.example.com/content1.php#services</loc>