2

我正在使用 Feed crawlIssues = wtr.GetCrawlIssues(encodedSiteID); 从我的网站管理员工具帐户中获取抓取错误。有超过 5k 个错误,但上面的代码只检索前 100 个。如何检索所有错误?

谢谢

4

1 回答 1

4

我遇到了和你一样的问题,我也只有前 100 个错误。基本上,由于站长工具中的一个错误,它只显示了 100 个批次的错误。

据我所知,它没有内置的解决方案,但有一种解决方法。您可以使用提供的 ExecRequest.exe 命令行工具通过 http 请求访问数据,而不是使用 GetCrawlIssues 函数。基本用法是:

ExecRequest cl QUERY http://www.google.com/webmasters/tools/feeds/example_site.com/crawlissues/?start-index=1&max-results=100 example@gmail.com mypassword

这将输出生成的 XML 到控制台。您可以指定起始点和要下载的错误数:
?start-index=startIndex
&max-results=100
您可以将 max-result 值设置为您想要的任何值,但它最多只能下载 100 个项目。
批量下载后,可以从下载的xml文件中获取数据。

如果你只需要数据,我还用 Python 写了一个小脚本,你可以在这里查看,非常简单。

于 2013-12-12T11:10:12.197 回答