我正在寻找一些东西*来帮助我处理和解释数据。姓名、地址等数据。
目前,我大量使用 Python 来查找一条信息是否与另一条信息相关,但我注意到我的很多代码可以很容易地用某种查询语言代替。
主要是,我需要一个可以导入任何格式的数据的环境,无论是 xml、html、csv 还是 excel 或数据库文件。我希望软件能够阅读它并告诉我有哪些列等等,这样我就可以只担心编写解释它的代码了。
这听起来是否足够具体,如果是的话,是否有人拥有如此优雅的软件?
*可以是编程语言,IDE,它们的组合。
我正在寻找一些东西*来帮助我处理和解释数据。姓名、地址等数据。
目前,我大量使用 Python 来查找一条信息是否与另一条信息相关,但我注意到我的很多代码可以很容易地用某种查询语言代替。
主要是,我需要一个可以导入任何格式的数据的环境,无论是 xml、html、csv 还是 excel 或数据库文件。我希望软件能够阅读它并告诉我有哪些列等等,这样我就可以只担心编写解释它的代码了。
这听起来是否足够具体,如果是的话,是否有人拥有如此优雅的软件?
*可以是编程语言,IDE,它们的组合。
你看过 Python 中的 Pandas 模块吗?http://pandas.pydata.org/pandas-docs/stable/ 当与 Ipython notebook 结合使用时,它是一个很棒的数据操作平台。
我认为它可以让你做很多你想做的事情。我不确定它处理 html 的效果如何,但它是为处理 csv、excel 和数据库文件而构建的