我希望设计一个可以使用 Google 搜索引擎 API 检测所有格式的抄袭(基于网络)的应用程序。这种应用程序需要什么资源。基本上,用户可以上传一个文件,该文件将根据网络上的各种格式进行检查。我读过有网络爬虫,但我们究竟如何使用它们。Google Search Appliance API 是正确的方法吗?
另外我之前没有使用过 Google API,那么最好的开始方式是什么?
非常感谢
我希望设计一个可以使用 Google 搜索引擎 API 检测所有格式的抄袭(基于网络)的应用程序。这种应用程序需要什么资源。基本上,用户可以上传一个文件,该文件将根据网络上的各种格式进行检查。我读过有网络爬虫,但我们究竟如何使用它们。Google Search Appliance API 是正确的方法吗?
另外我之前没有使用过 Google API,那么最好的开始方式是什么?
非常感谢
也许http://www.google.com/alerts会做?您可以使用一些库进行一次查找,例如在 Ruby 中,它(乍一看)是一个galerts gem。在 Python 中,galerts包可以帮助您管理提要。其他语言可能有类似的库。之后,自行解析结果提要。