我正在寻找一种从加载的数据框中提取构造数据框的代码的方法。
考虑以下过程。
# Code to construct a df:
df = pd.DataFrame({'num_legs': [2, 4, 8, 0],
'num_wings': [2, 0, 0, 0],
'num_specimen_seen': [10, 2, 1, 8]},
index=['falcon', 'dog', 'spider', 'fish'])
# Obtain the df output:
df
num_legs num_wings num_specimen_seen
falcon 2 2 10
dog 4 0 2
spider 8 0 1
fish 0 0 8
我正在寻找一个自动化的反向过程。假设我从 df 开始,它是从 csv 文件加载的(下面的示例,与上面相同的 df)。
df =
pd.read_csv('/path_to_data/df.csv', sep='\t')
df
num_legs num_wings num_specimen_seen
falcon 2 2 10
dog 4 0 2
spider 8 0 1
fish 0 0 8
在这一点上,有没有办法提取代码(如下所列),这将构建 df,假设我没有代码开始。
df = pd.DataFrame({'num_legs': [2, 4, 8, 0],
'num_wings': [2, 0, 0, 0],
'num_specimen_seen': [10, 2, 1, 8]},
index=['falcon', 'dog', 'spider', 'fish'])
这并不总是有用的,但我很好奇这是否可以做到,出于某些可移植性目的。例如,这将允许共享一个 jupyter notebook 文档,而无需引用任何外部内容。并允许数据分析的完全自我维持的可复制性。