0

我想从http://stat.data.abs.gov.au/Index.aspx?DataSetCode=ATSI_BIRTHS_SUMM中可用的数据准备数据集

数据接口:

http://stat.data.abs.gov.au/restsdmx/sdmx.ashx/GetData/ATSI_BIRTHS_SUMM/1+4+5+7+8+9+10+13+14+15+18+19+20。 IM+IB.0+1+2+3+4+5+6+7.A/全部

from pandasdmx import Request

Agency_Code = 'ABS'
Dataset_Id = 'ATSI_BIRTHS_SUMM'

ABS = Request(Agency_Code)
data_response = ABS.data(resource_id='ATSI_BIRTHS_SUMM')
print(data_response.url)

DF = data_response.write(data_response.data.obs(with_values=True, with_attributes=True), parse_time=False)

上面给出了错误:ValueError:类型名称和字段名称不能是关键字:'None'

DF = data_response.write(data_response.data.series, parse_time=False), This works but Dimension items coming in column wise.

支持链接:

http://stat.data.abs.gov.au/restsdmx/sdmx.ashx/GetDataStructure/all
http://stat.data.abs.gov.au/restsdmx/sdmx.ashx/GetDataStructure/ATSI_BIRTHS_SUMM
http://stat.data.abs.gov.au/Index.aspx?DataSetCode=ATSI_BIRTHS_SUMM

请建议更好的方法来检索数据。

4

1 回答 1

1

你的例子

DF = data_response.write(data_response.data.series, parse_time=False)

产生一个堆叠的 DataFrame,unstack().reset_index()你会得到一个“扁平”的 DataFrame。

data_response.write().unstack().reset_index()
  MEASURE INDIGENOUS_STATUS ASGS_2011 FREQUENCY TIME_PERIOD       0
0       1                IM         0         A        2001  8334.0

这是你想要的?

于 2019-12-04T10:43:18.510 回答