我正在寻找一种方法来获取 SDMX 文件(比如这里:http ://www12.statcan.gc.ca/datasets/Alternative.cfm?PID=105929&EXT=SDMX )并将它们处理成 Postgresql 表。
我可以将 rsdmx ( https://cran.r-project.org/web/packages/rsdmx/index.html ) 用于较小的数据集,但对于大型数据集,我们在 R 中遇到了许多限制。
PandaSDMX ( https://pandasdmx.readthedocs.io/en/latest/ ) 似乎可以解决其中一些问题,但我在 Python 方面没有经验,似乎无法让语法正常工作。我可以使用 Response.get() 将本地文件加载为响应对象,但不确定从那里去哪里。
我知道我需要应用代码表(结构文件),但我不确定如何执行或制作它,以便我可以使用 odo(http://odo.pydata.org/en/latest/)发送它到PostgreSQL。
希望有人可以提供帮助或建议另一种追求方法。