1

我正在尝试将消费者金融保护局 (CFPB) 加载到 Python 3.4 中的 Pandas 数据框中。我的代码有效,但似乎我通过 SODA API 限制为 1,000 行。我正在使用应用令牌并在此处引用 URL

df = pd.read_json('http://data.consumerfinance.gov/resource/x94z-ydhh.json?$$app_token=XXXXXXXXXXXXXXXX')

数据结构是完美的,但是我仅限于 1000 行数据(应该接近 300000 行数据)。

当我通过浏览器(使用应用程序令牌)访问相同的 URL 时,它似乎也只拉入了 1,000 行。我的印象是,使用 App Token 您可以访问整个数据集,这不正确吗?

4

1 回答 1

7

查看有关参数的文档$limit

$limit 参数控制返回的总行数,默认为每个请求 1,000 条记录。

注意: $limit 的最大值是 50,000 条记录,如果超过该限制,您将收到 400 Bad Request 响应。

所以你只是得到了默认的记录数。

将无法在一次API 调用中获取所有 300,000 条记录- 这将需要多次$limit调用$offset

尝试:

http://data.consumerfinance.gov/resource/x94z-ydhh.json?$limit=50000&$$app_token=XXXXXXXXXXXXXXXX
于 2015-06-19T17:29:25.300 回答