我正在尝试一些机器学习技术。在这种情况下, PSO-KMean用于聚类。
我想我可以通过点击 Stack Exchange API 来测试它,以获取标签列表和每个标签的计数,然后将其转换为代表“标签空间”中每个站点位置的浮点数组
我正在使用Py-Stack-Exchange
from stackauth import StackAuth
import stackexchange
site_data = {}
n_sites= 20
for site_auth in StackAuth().sites()[3:n_sites+3]: #Skip big 3
site=site_auth.get_site()
site_tags = {}
for tag in site.all_tags():
site_tags[(tag.name)]=tag.count
site_data[site.domain] = site_tags
现在,在我搞砸了几次之后, 这一定已经超过了 10,000 个请求的限制,因为我得到了StackExchangeError: 502 [throttle_violation]: too many requests from this IP, more requests available in 81719 seconds
所以我猜它正在为网站上的每个标签发出请求以获取其计数。这对任何人都没有好处,对我来说速度较慢,并且在 Stack Exchange 基础架构上需要做更多的工作。我觉得必须有一种方法可以在每个站点一次点击中获取信息,但对 API 还不够熟悉,无法解决。