我的网站根据以下规范提供动态创建的内容以供爬虫查看: https ://developers.google.com/webmasters/ajax-crawling/docs/specification 。这样,Google 爬虫使用以下语法索引了大约 5000 个网址: http://www.unclestock.com//app.jsp?_escaped_fragment_=s=AAPL http://www.unclestock.com//app.jsp?_escaped_fragment_= s=谷歌
使用 Google 的网站管理员工具查看我的抓取报告,我确信这些页面已成功抓取。但是,在通过 Google 搜索时,它们不会显示为结果。请注意,我确实找到了我的一般网站,在“更多结果”下,我找到了大约 40 个动态生成的页面,但显然这不是我想要的。我想根据它们的内容(AAPL、GOOG、...)找到这些页面。也许,爬虫认为我的页面或多或少是相同的......但事实并非如此。